自定义步长提取样本数据统计学中,有一种常用经典的抽样方法名为等距抽样。
简单滴理解,就是按照同样大小的间隔将数据等分,在从中抽取样本。上图问题的本质正是等距抽样数据的提取。
等距抽样的含义本文开篇案例中,已经将需要提取的数据标为了黄色。
因此,最简单的方法就是按颜色筛选将黄色筛选出来,通过定位可见单元格,筛选出来的数据,拷贝出来到抽样提取的数据表,即大功告成。
Good!
可见单元格拷贝如果案例中没有标色,那么要怎样提取呢?
这时可能你已经想到用序号的办法。
没错,这也是个好方法!
首先确定要提取的序号,然后使用查询函数,以序号为关键字,将数据链接到提取表中。
查询函数提取数据问题是,提取序号如何确定?
案例要求步长是3,相邻提取序号的差就是3。所以只要将上一个提取的序号加上3就得出当前提取的序号,当前提取的序号加上3,就是下一个提取的序号。比如第一个提取序号为1,第二个就是1+3=4,第三个就是4+3=7……
而查询公式以单元格F6为例,则为
INDEX(C:C,MATCH(E6,B:B))
表哥Tips:查询函数也可以使用函数VLOOKUP。而且,由于样本数据为数字形式,除了查询公式外,还可以用函数sumif。
除了提取序号还有没有其他方法?
分析取数的关键在于如何定位行号,而刚才已经分析过相邻两个取数的序号之差是3,因此每一个序号都是由上一个向下移动3个单位而得,而所取数据的定位也是由上一个取数所在行向下移动3行而得。
根据这个思路,我们引用专门用于定位的函数OFFSET(reference, rows, cols, [height], [width])。
OFFSET参数设置本文案例中,OFFSET函数参数一为起始单元格C2,参数三是列号,由于列号始终不变,因此为0,而参数二是向下移动的行号,其变化规律如上所述,等于步长与行号差的乘积。
OFFSET定位数据区域以单元格H6为例,公式为:
H6=OFFSET($C$2,3*(ROW($H6)-ROW($H$6)),0)
OFFSET函数非常优势的一点就是,使用相对位移的方式进行计算单元格的定位。更优的是不但可以对某一单元格进行定位,而且可以区域定位。也可以由一个单元格,扩展到一片计算区域进行运算。掌握熟练后,应用起来非常方便、灵活。
是非常值得学习的必备函数之一。
感谢你关注表哥,
并欢迎留言分享你的大法或者烦恼
也许下一个专题就是为你定制哦
撒花↖(^ω^)↗