请教如何等分布分割一个连续变量

m
microsat
楼主 (北美华人网)
一个连续变量。假设从1到100. 这个变量的集合有100个数。 现在要把这100个数分割成60个数,和40个数。
分割完后,他俩最好能等分布。
请问有什么工具或者算法能完成这个吗?
看上去不难。但是怎么实现起来不容易呢?

g
gokgs
Chatgpt 怎么说?
招猫抵狗
生成cumulative histogram再做
O
OrangeKitten
R裡面有sample function,可以從一個樣本裡面抽樣。
m
microsat
R裡面有sample function,可以從一個樣本裡面抽樣。
OrangeKitten 发表于 2023-11-02 13:38

但是那个sample函数出来的,不是等分布的。 比如1:10 sample的结果可能是1,2,3,4 和5,6,7,8,9,10
这显然不是等分布。
m
microsat
Chatgpt 怎么说?
gokgs 发表于 2023-11-02 13:18

它不可能预先编程了这个。
chatgpt的程序员还不可能牛到这种程度。 除非,他看了我这个帖子。去埋了个地雷。
S
SSBN826
Excel column A 1:100 Column B random(), then sort by column B and takes first 60 numbers
f
facet
一个连续变量。假设从1到100. 这个变量的集合有100个数。 现在要把这100个数分割成60个数,和40个数。
分割完后,他俩最好能等分布。
请问有什么工具或者算法能完成这个吗?
看上去不难。但是怎么实现起来不容易呢?


microsat 发表于 2023-11-02 13:12

首先,你得假设你这100个数是来自同一个分布,而且是独立采样获得的,否则无法做 如果这个保证了就好办了,你就用不放回采样随机从这个集合里采40个数就行了 这40个点一个集合,剩下的60个点一个集合
f
facet
另外,你这里的“连续变量”听上去可能是指一个集合的等差数列,连续变量不是你说的那个意思
把等差数列拆成两个等差数列不可能用采样的方式获取,必定是确定性方法