样本 样本点 sample observation

其实这是我研究生的时候就有的一个疑问。
一个数据集row和column,有些人把row叫样本或sample(国内外),我觉得不确切但也不影响理解,根据wikipedia和一些中文资料,样本就是总体的抽样,里面的元素叫做sample points/sampling units。样本点另外一个意义是统计学里面随机事件发生的每一种可能性,比如扔骰子123456每一个是样本点,合称样本空间。
综上我觉得数据科学里面sample(样本)和sample points(样本点)更确切。但是别人把每一行称为样本,样本容器称为样本集,也不影响沟通就是,经常也看到一些老手说30个样本的样本集。
这个问题不用纠结,这里总结一下
row/record/observation
column/feature/attribute/variable

留言

熱門文章