一种方法教会你理清科研思路
我们都知道统计学方法的重要性,那是因为统计方法可以帮助我们将杂乱无章的数据形成模型,并且发表高质量的文章。但是殊不知,统计方法是不能解决研究设计之初就已经造成的问题。这个时候,让我们引入一种简单高效的工具叫做Directed acyclic graphs(DAGs)。
DAGs方法可以用于分析各种偏倚(正如我们上一期所讲,偏倚分为:选择偏倚、混淆偏倚和信息偏倚),也可以用于分析研究设计和分析过程中潜在的问题。
工具介绍
E:暴露变量(cause)
Y:结果变量(effect)
C:混淆因素
注意:
- 1.用带有箭头的线连接并表示变量间的关系;
- 2.箭头从原因变量指向结果变量,反之不可以;
- 3.变量的排序表示变量发生的时间关系,如上图,E变量发生在Y变量之前,发生在C变量之后(optional);
- 4.重点:一个合格的DAG需要包含所有与E和Y的共同相关联的变量。
然后,我们一起来制作一个DAG帮助理解吧!在未来的讲解过程中会常使用到DAG。
假设:研究携带火机和肺癌的关系
E:是否携带火机
Y:是否得肺癌
C:是否吸烟
具体解释一下:
- 1.我们希望研究携带火机与肺癌的关系;
- 2.吸烟者常携带火机,吸烟者容易得肺癌;因此,吸烟是E和Y的共同的原因,C是一个混淆因素(confounding);也就是说,如果携带火机组和非携带火机组的吸烟率不一样,将极大干扰我们发现E和Y的关联性;
- 3.如果我们设计试验的时候,没有收集吸烟这个变量,那么我们将永远无法验证E和Y的关联性;
- 4.重点:当我们开始一个研究设计的时候,应该尽可能寻找到所有E和Y共同相关联的因素,这样在后期的分析过程中才能考虑所有干扰E和Y因果关系的可能性。考虑的共同因素越多,association就越接近于causation。