请教统计学问题:测试体育锻炼能增进人的睡眠

m
microsat
楼主 (北美华人网)
实验分成两组:A组100人,进行体育锻炼;B组100人,不进行体育锻炼。
A组100个人,对于每个人,在体育锻炼前,测量平均睡眠质量(pre-sleep-quality)。然后进行1个月的体育锻炼,结束后,测量平均睡眠质量(post-sleep-quality)
B组100个人,对于每个人,在起始点,测量平均睡眠质量(pre-sleep-quality)。然后1个月后 (没有体育锻炼),测量平均睡眠质量(post-sleep-quality)
请问大家都有哪些好方法来测试体育锻炼能增进人的睡眠?
我来说说我常用的一个方法,在A组,对于每个人,得到睡眠质量的变化 (change of sleep quality after one month), 定义为delta_A 在B组,对于每个人,也得到睡眠质量的变化 (change of sleep quality after one month),定义为delta_B 然后,用 t test来比较delta_A和delta_B
请问,为什么统计大牛并不喜欢这个方法?是否有更好的更准的统计方法?
补充:其他一些因素暂时不考虑(比如:年龄、性别等)。也就是仅仅针对以上数据,一个最好的测试模型该如何建立?
谢谢! 
d
dolphina
Randomization, 分组100人时候就要盲选分组啊
m
microsat
dolphina 发表于 2024-07-08 18:11
Randomization, 分组100人时候就要盲选分组啊

这个问题已经考虑了。上面的200个人分成A,B两组是随机的。
我要请教的问题,是随后的统计测试问题。
谢谢
蓝黛
一旦选中测睡眠会不会就此影响睡眠质量
w
wantU
chatgpt
"在你所描述的实验设计中,常用的方法确实是比较两组的睡眠质量变化(delta_A 和 delta_B)来评估体育锻炼对睡眠质量的影响。你提到的方法是使用独立样本 t 检验来比较两个组的平均变化,这在统计学中被称为“独立样本 t 检验”。 为什么统计大牛可能不喜欢这个方法? 个体差异的忽视: 每个人的基线睡眠质量(pre-sleep-quality)可能有很大的差异,这会影响他们的变化量(delta)。 直接比较 delta_A 和 delta_B 可能会忽略这些基线差异的影响。 组内相关性的忽视: 在 A 组和 B 组内,pre 和 post 的测量是相关的。如果只看 delta,而不考虑 pre 和 post 的配对关系,可能会丢失一些有用的信息。 假设的敏感性: t 检验的有效性依赖于一些假设,如正态分布和方差同质性。如果这些假设不满足,t 检验的结果可能不可靠。 更好的统计方法 配对样本 t 检验: 由于每个人在 pre 和 post 都有一个测量值,所以可以使用配对样本 t 检验来比较 pre 和 post 的变化。这种方法可以更好地控制个体差异。 对 A 组和 B 组分别进行配对 t 检验,然后比较两组的平均变化量。 线性混合效应模型(Linear Mixed Effects Model): 这种方法可以同时考虑组内和组间的变化,适用于有重复测量的实验设计。 可以在模型中引入随机效应来控制个体差异,并且可以更灵活地处理不满足正态分布和方差同质性的情况。 重复测量方差分析(Repeated Measures ANOVA): 这种方法可以同时分析两个因素(时间和组别)对睡眠质量的影响,适合处理有重复测量的数据。 可以检测到时间和组别之间的交互效应。 实施例子 假设我们使用线性混合效应模型,可以使用以下 R 代码来实现: R Copy code library(lme4) # 假设你的数据存储在一个数据框 df 中,具有以下列: # id: 受试者编号 # group: 组别(A 或 B) # time: 时间点(pre 或 post) # sleep_quality: 睡眠质量 # 线性混合效应模型 model <- lmer(sleep_quality ~ group * time + (1|id), data=df) # 输出模型结果 summary(model) 这种方法可以更全面地分析数据,考虑个体差异,并检测时间和组别的交互效应。 希望这些解释和方法对你有所帮助!如果你有进一步的问题,欢迎继续讨论。"
m
microsat
蓝黛 发表于 2024-07-08 18:41
一旦选中测睡眠会不会就此影响睡眠质量

这个存在。
但是我想问的问题不是这个。
我想问的是 假设不引入其他因素的情况下,当前的测试模型应该如何建立最好?
m
microsat
wantU 发表于 2024-07-08 18:41
chatgpt
"在你所描述的实验设计中,常用的方法确实是比较两组的睡眠质量变化(delta_A 和 delta_B)来评估体育锻炼对睡眠质量的影响。你提到的方法是使用独立样本 t 检验来比较两个组的平均变化,这在统计学中被称为“独立样本 t 检验”。 为什么统计大牛可能不喜欢这个方法? 个体差异的忽视: 每个人的基线睡眠质量(pre-sleep-quality)可能有很大的差异,这会影响他们的变化量(delta)。 直接比较 delta_A 和 delta_B 可能会忽略这些基线差异的影响。 组内相关性的忽视: 在 A 组和 B 组内,pre 和 post 的测量是相关的。如果只看 delta,而不考虑 pre 和 post 的配对关系,可能会丢失一些有用的信息。 假设的敏感性: t 检验的有效性依赖于一些假设,如正态分布和方差同质性。如果这些假设不满足,t 检验的结果可能不可靠。 更好的统计方法 配对样本 t 检验: 由于每个人在 pre 和 post 都有一个测量值,所以可以使用配对样本 t 检验来比较 pre 和 post 的变化。这种方法可以更好地控制个体差异。 对 A 组和 B 组分别进行配对 t 检验,然后比较两组的平均变化量。 线性混合效应模型(Linear Mixed Effects Model): 这种方法可以同时考虑组内和组间的变化,适用于有重复测量的实验设计。 可以在模型中引入随机效应来控制个体差异,并且可以更灵活地处理不满足正态分布和方差同质性的情况。 重复测量方差分析(Repeated Measures ANOVA): 这种方法可以同时分析两个因素(时间和组别)对睡眠质量的影响,适合处理有重复测量的数据。 可以检测到时间和组别之间的交互效应。 实施例子 假设我们使用线性混合效应模型,可以使用以下 R 代码来实现: R Copy code library(lme4) # 假设你的数据存储在一个数据框 df 中,具有以下列: # id: 受试者编号 # group: 组别(A 或 B) # time: 时间点(pre 或 post) # sleep_quality: 睡眠质量 # 线性混合效应模型 model <- lmer(sleep_quality ~ group * time + (1|id), data=df) # 输出模型结果 summary(model) 这种方法可以更全面地分析数据,考虑个体差异,并检测时间和组别的交互效应。 希望这些解释和方法对你有所帮助!如果你有进一步的问题,欢迎继续讨论。"

请问,你认为这个提供了源代码的线性混合效应模型更好, 还是我一开始就说的“配对样本 t 检验” 更好?
s
squidren
不要分組,每個人都運動,測每個人的 PRE 跟 POST 睡眠品質,你不就有雙倍的樣本? A組跟B組的 PRE 應該差不多。B組的 PRE 跟 POST 應該差不多,也就是說你原來的模組有很多多餘的操作。此外,兩組可能都有安慰效應,A組覺得有運動所以睡的應該比較好,B組覺得啥都沒做,睡眠應該跟原來一樣。可以給 B 組做無效的運動,比如散步 VS A組的高強度運動,來降低安慰效應造成的差異。
蓝黛
回复 6楼 microsat 的帖子
你分组就是一种暗示
M
MMitchell
这个试验没法双盲做。这能在入组前尽量stratify一些confounding factor。
c
calsunny
microsat 发表于 2024-07-08 18:49
请问,你认为这个提供了源代码的线性混合效应模型更好, 还是我一开始就说的“配对样本 t 检验” 更好?

ChatGPT 给出的答案: Paired t-test Advantages: Simple and specific: Easy to implement and interpret for comparing two related samples. Direct comparison: Directly compares pre- and post-measurements within each group. Disadvantages: Limited scope: Only compares pre and post within a single group, without considering group differences or interactions. Multiple comparisons: Requires multiple tests for multiple groups, increasing the risk of Type I error.
要我选,也会选择Mixed Effect Model
m
microsat
calsunny 发表于 2024-07-08 20:07
ChatGPT 给出的答案: Paired t-test Advantages: Simple and specific: Easy to implement and interpret for comparing two related samples. Direct comparison: Directly compares pre- and post-measurements within each group. Disadvantages: Limited scope: Only compares pre and post within a single group, without considering group differences or interactions. Multiple comparisons: Requires multiple tests for multiple groups, increasing the risk of Type I error.
要我选,也会选择Mixed Effect Model

chatgpt就是知道一个关键词,就可以胡乱说一气。
这个例子,就是实证。
虽然,pre和post可以paired,但是A和B之间根本不可能paired。
这个chatgpt到底是谁设计的。怎么这么次?