python 查找string问题 - 2020年7月23日北美华人网存档

接近 5 年

楼主 (北美华人网)

python pandas read in csv file1 like this:
name string a1 b1 a2 b2 a3 b3 ..... I have another csv file2, but in different order.
a3 a1 a2...
I like to find the the matching b string for each row in csv2 file, and write them out to csv file 3 like this:
a3 b3 a1, b1 a2 b2
Is there an easy way to do this using Python?

walkingroman

接近 5 年

load csv1 and generate a dict using pandas to_dict. Then load csv2 do a map.

decadence

接近 5 年

load csv1 and generate a dict using pandas to_dict. Then load csv2 do a map.
walkingroman 发表于 2020-07-22 20:54

Great, thanks and I will give it a try.

surezzz

接近 5 年

回复 1楼decadence的帖子
最基本的indexing就搞定了。

decadence

接近 5 年

load csv1 and generate a dict using pandas to_dict. Then load csv2 do a map.
walkingroman 发表于 2020-07-22 20:54

Could you provide more details on the map function? thanks.

decadence

接近 5 年

回复 1楼decadence的帖子
最基本的indexing就搞定了。
surezzz 发表于 2020-07-22 21:20

more details or example? thanks

AaronBush

接近 5 年

楼主进错🚪了

decadence

接近 5 年

楼主进错🚪了
AaronBush 发表于 2020-07-22 21:37

啥还有门？我从来就不管有没有门，直接走就行了。我想自动化我的pet project。

Zorua

接近 5 年

回复 1楼decadence的帖子
可以用merge把兩個表按name這一列的值拼起來

decadence

接近 5 年

回复 1楼decadence的帖子
可以用merge把兩個表按name這一列的值拼起來
Zorua 发表于 2020-07-22 22:29

多谢多谢，我试试看。

zejuanxiaoyu

接近 5 年

Could you provide more details on the map function? thanks.
decadence 发表于 2020-07-22 21:22

csv2读进来读成list 循环找对应csv1生成的dict key 把对应的dict item 存到csv3

walkingroman

接近 5 年

Could you provide more details on the map function? thanks.
decadence 发表于 2020-07-22 21:22

myDataFrame['column1'].map(myDict)

yukosmile

接近 5 年

回复 1楼decadence的帖子
如果不是unique value,建map会出错吧。用pdf.merge 方便省事

三

三省吾身

接近 5 年

用merge就可以

letsfly

接近 5 年

可以试试command line awk
cat file1.txt file2.txt | awk 'NF>1{a{$1}=$2;} NF==1{print $1" "a{$1}}

Purified

接近 5 年

Great, thanks and I will give it a try.
decadence 发表于 2020-07-22 20:55

这俩string 排序是不一样的吧，也就是说a1和b1在各自的csv中读进来的话如果是存成dict hash过去的list，index是不一样的。除非这辆 csv你有一个共同的格外colume用于判断排序
比如如果 A.csv,读进来的dict， A1这个key 下面就是一个list [a1,a2,a3] ，额外something 这个key下面就是[k1,k2,k3] ,你也可以建一个 k 到a 的dict A1 额外something a1 k1 a2 k2 a3 k3

B.csv 同样做法 B1 额外something b3 k3 b2 k2 b1 k1
这样通过共同的k 来找到mapping 关系。