我正在使用生物化学家数据集。我在哪里可以找到包含每个变量描述的“数据字典”?
这就是我正在查看的:
import pandas as pd
from pydataset import data
data('bioChemists')
我已经用谷歌搜索并尝试寻找运算符,但没有运气!
pydataset 软件包不包含生物化学家数据集的描述。但是,根据输出的数据框,我们可以对变量进行推断。
数据集
bioChemists
包含 2 个变量。它们似乎表示学术工作中男性和女性的比例,可能是随时间推移的。
-
year
:年份,可能代表收集数据的年份。 -
prop
:女性或男性学者所占的比例。
你可以通过对数据框应用
.describe()
或
.info()
方法获得更多信息。例如:
import pandas as pd
from pydataset import data
biochem = data('bioChemists')
print(biochem.info())
print(biochem.describe())
如果你需要有关数据集的更多上下文信息,你可以尝试搜索“生物化学家女性比例”或类似的术语。
希望这有帮助!
标签:python,pandas,dataframe,dictionary From: 78804430