问题:Pandas 在保存到 CSV 时似乎正在交换数据框中的列数据?到底是怎么回事
# Code
myDF.to_csv('./myDF.csv')
print(myDF)
# Print Output
dd-3 dd-4
5346177884_triplet+ 3 3
5346177884_dublet- 5 5
5346177884_dublet+ 3 3
...
1434120345_triplet+ NaN 1
1434120345_singlet+ NaN 3
# CSV File
,dd-3,dd-4
5346177884_triplet+,3.0,3
5346177884_dublet-,5.0,5
5346177884_dublet+,3.0,3
...
1434120345_triplet+,,1
1434120345_singlet+,,3
以前有人见过这样的事情吗?
回答1
请务必检查原始 CSV 文件,以确保它不是您用来显示错误解释文件的 CSV 的工具。例如 pandas 会将 nans 输出为 csv 文件中的空格。虽然可以将导入时的 libercalc 设置为合并重复分隔符,例如带有多个空格的空格分隔文件。如果您在导入分隔符之间有空格的 csv 时不小心打开了该功能,您可能会看到类似于您报告的效果。
问题:
# CSV Format
,h1,h2,3
obj,v1,v2,v3
# PD handling NAN for v1 & v2
,h1,h2,3
obj,,,v3
# Merge delimiter interpretation
,h1,h2,h3
obj,v3
# Resulting View
h1 h2 h3
obj_number v3