首页 > 其他分享 >囚徒5.5_将给数字特征转化为数字特征

囚徒5.5_将给数字特征转化为数字特征

时间:2024-06-05 20:24:43浏览次数:22  
标签:数字 特征 feature column tf import dftrain 5.5

代码片段是TensorFlow中特征列(feature columns)的创建过程,用于处理分类和数值数据。这在构建机器学习模型时非常有用,特别是在使用TensorFlow的高级API如TF Estimator时。

这里是代码片段的解释和稍微修改后的版本:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from IPython.display import clear_output
from six.moves import urllib

import tensorflow.compat.v2.feature_column as fc

import tensorflow as tf
# Load dataset.
dftrain = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/train.csv') # training data
dfeval = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/eval.csv') # testing data
dftrain.head()
y_train = dftrain.pop('survived')
y_eval = dfeval.pop('survived')
# 分类特征列名
CATEGORICAL_COLUMNS = ['sex', 'n_siblings_spouses', 'parch', 'class', 'deck',
                       'embark_town', 'alone']
# 数值特征列名
NUMERIC_COLUMNS = ['age', 'fare']

feature_columns = []  # 特征列列表

# 为每个分类特征创建一个带有词汇表的分类特征列
for feature_name in CATEGORICAL_COLUMNS:
  # 从数据框中获取特征的唯一值列表
  vocabulary = dftrain[feature_name].unique()
  # 将分类特征列添加到特征列列表
  feature_columns.append(tf.feature_column.categorical_column_with_vocabulary_list(feature_name, vocabulary))

# 为每个数值特征创建一个数值特征列
for feature_name in NUMERIC_COLUMNS:
  # 将数值特征列添加到特征列列表,指定数据类型为tf.float32
  feature_columns.append(tf.feature_column.numeric_column(feature_name, dtype=tf.float32))

# 打印特征列列表
print(feature_columns)

请确保在运行这段代码之前,你已经有一个名为 dftrainpandas 数据框,并且它包含了所有在 CATEGORICAL_COLUMNSNUMERIC_COLUMNS 中指定的列。dftrain 应该包含用于训练模型的数据。

这段代码首先为分类特征创建特征列,使用 categorical_column_with_vocabulary_list,它需要一个特征名和该特征的所有可能值的列表(词汇表)。然后,为数值特征创建特征列,使用 numeric_column,它需要一个特征名和数据类型。

在TensorFlow中,特征列是一个非常强大的工具,可以帮助你将原始数据转换为模型可以使用的格式。

标签:数字,特征,feature,column,tf,import,dftrain,5.5
From: https://www.cnblogs.com/qt-pyq/p/18233697

相关文章

  • 力扣刷题--2553. 分割数组中数字的数位【简单】
    题目描述给你一个正整数数组nums,请你返回一个数组answer,你需要将nums中每个整数进行数位分割后,按照nums中出现的相同顺序放入答案数组中。对一个整数进行数位分割,指的是将整数各个数位按原本出现的顺序排列成数组。比方说,整数10921,分割它的各个数位得到[1,0......
  • 程序分享--常见算法/编程面试题:整数转罗马数字
    关注我,持续分享逻辑思维&管理思维&面试题;可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导;推荐专栏《10天学会使用asp.net编程AI大模型》,目前已完成所有内容,持续上传中。一顿烧烤不到的费用,让人能紧跟时代的浪潮。从普通网站,到公众号、小程序,再到AI大模型网站。干货满满......
  • webshell工具流量特征
    一、蚁剑(PHP用base64加密)将蚁剑的正文内容进行URL解码后,流量最中明显的特征为@ini_set("display_errors","0");这段代码基本是所有WebShell客户端链接PHP类WebShell都有的一种代码,但是有的客户端会将这段编码或者加密,而蚁剑是明文,所以较好发现,同时蚁剑也有eval这种明显的特征。......
  • 简单4步,带你用华为云MetaStudio制作数字人短片
    本文分享自华为云社区《使用MetaStudio生产线四步制作数字人视频》,作者:yd_298097624。随着AIGC新技术尤其是大模型技术的发展,音视频行业、数字内容生产行业正在经历这从生产方式和生产效率上的一个巨大变化。预测到2030年有AI大模型生成的数字内容比例将高达90%,包括通过AIGC来生......
  • C#WPF数字大屏项目实战10--不良指标分页
    1、区域划分2、区域布局 3、视图模型  4、控件绑定5、运行效果 走过路过,不要错过,欢迎点赞,收藏,转载,复制,抄袭,留言,动动你的金手指,财务自由......
  • 带DSP音效处理D类数字功放TAS5805M中文资料
    国产替代D类数字功放中文资料访问下方链接ACM86282×41W立体声1×82W单通道数字功放中文寄存器表内置DSP多种音频处理效果ACM8628M-2×41W立体声或1×82W单通道数字功放1特性具有增强处理能力和低功率损耗的TAS5805M23W、无电感器、数字输入、立体声、闭环D类音频......
  • 【教学类-13-05】20240604《数字色块图-5*7*8-A4横板-横切》中4班
    背景需求:【教学类-13-04】20230404《数字色块图+判断密码是否正确-5*7*8-A4横板-横切》(中班主题《我爱我家》)_图案密码色块-CSDN博客文章浏览阅读530次。【教学类-13-04】20230404《数字色块图+判断密码是否正确-5*7*8-A4横板-横切》(中班主题《我爱我家》)_图案密码色块......
  • 【信息化人员必备知识&面试宝典】HTTP协议的状态码:那些数字背后的秘密
    【信息化人员必备知识&面试宝典】HTTP协议的状态码:那些数字背后的秘密状态码的分类与基本概念核心状态码解读与实战案例一:200OK——一切安好案例二:404NotFound——迷失的页面案例三:301MovedPermanently——永久搬家案例四:500InternalServerError——服务......
  • 数据分析每周挑战——心衰患者特征数据集
    这是一篇关于医学数据的数据分析,但是这个数据集数据不是很多。背景描述本数据集包含了多个与心力衰竭相关的特征,用于分析和预测患者心力衰竭发作的风险。数据集涵盖了从40岁到95岁不等年龄的患者群体,提供了广泛的生理和生活方式指标,以帮助研究人员和医疗专业人员更好地理解......
  • Vlog与直播收益:走进数字内容创业的新时代
    随着数字化时代的到来,互联网和社交媒体的普及,内容创业已经成为了许多人追求的职业。在内容创业领域,Vlog和直播无疑是两大热门的方式,吸引了大量创作者和观众。这两种方式不仅改变了传统媒体的格局,也开辟了新的收益模式和商业机会。Vlog,即视频博客,是指通过视频的形式记录生活、分享......