深度学习_模型调用预测

时间：2024-09-01 13:57:50浏览次数：10

标签：调用 df 模型 cols submit sparse 深度 import data

概要

应用场景：用户流失
本文将介绍模型调用预测的步骤，这里深度学习模型使用的是自定义的deepfm

代码

导包

import pandas as pd
import numpy as np

import matplotlib.pyplot as plt
import seaborn as sns
from collections import defaultdict  
from scipy import stats
from scipy import signal
from tqdm import tqdm
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix, f1_score
from scipy.spatial.distance import cosine

import lightgbm as lgb

from sklearn.preprocessing import LabelEncoder, MinMaxScaler, StandardScaler
from tensorflow.keras.layers import *
import tensorflow.keras.backend as K
import tensorflow as tf
from tensorflow.keras.models import Model

import os,gc,re,warnings,sys,math
warnings.filterwarnings("ignore")

pd.set_option("display.max_rows", None)
pd.set_option("display.max_columns", None)

读取数据

data = pd.read_csv('df_04m.csv')

区分稀疏及类别变量

sparse_cols = ['shop_id','sex']
dense_cols  = [c for c in data.columns if c not in sparse_cols + ['customer_id', 'flag', 'duartion_is_lm']]

dense特征处理

def process_dense_feats(data, cols):
    d = data.copy()
    for f in cols:
        d[f] = d[f].fillna(0)
        ss=StandardScaler()
        d[f] = ss.fit_transform(d[[f]])
    return d

data = process_dense_feats(data, dense_cols)

sparse稀疏特征处理

def process_sparse_feats(data, cols):
    d = data.copy()
    for f in cols:
        d[f] = d[f].fillna('-1').astype(str)
        label_encoder = LabelEncoder()
        d[f] = label_encoder.fit_transform(d[f])
    return d

data = process_sparse_feats(data, sparse_cols)

切分训练及测试集

y = data['flag']
X = data.drop(['customer_id', 'flag', 'duartion_is_lm'], axis = 1)

数据处理成模型样式

X_sparse_x = [X[f].values for f in sparse_cols]
X_dense_x = [X[f].values for f in dense_cols]
y_label = [y.values]

X_sparse_x

模型读取

loaded_model = tf.keras.models.load_model('deepfm_model.h5')

模型预测

deepfm_prob = loaded_model.predict(X_sparse_x+X_dense_x, batch_size=4096*4, verbose=1)
deepfm_prob.shape

deepfm_prob

df_submit          = pd.DataFrame()
df_submit          = data
df_submit['prob']  = deepfm_prob
df_submit.head(3)

df_submit.shape

df_submit['y_pre'] = ''
df_submit['y_pre'].loc[(df_submit['prob']>=0.5)] = 1
df_submit['y_pre'].loc[(df_submit['prob']<0.5)]  = 0
df_submit.head(3)

df_submit = df_submit.reset_index()
df_submit.head(1)

df_submit = df_submit.drop('index', axis = 1)
df_submit.head(1)

df_submit.groupby(['flag', 'y_pre'])['customer_id'].count()

根据上述结果打印召回及精准

precision = 
recall  =

参考资料：自己琢磨将资料整合

标签：调用,df,模型,cols,submit,sparse,深度,import,data
From： https://blog.csdn.net/weixin_42504788/article/details/141753418

python读取txt文本文件-批量更改mysql数据库中一批用户的用户名的python脚本保存及转
一、python读取txt文本文件-批量更改mysql数据库中一批用户的用户名的python脚本保存做一个简单的事：使用python读取一个txt文件，里面存储着N行用户id，需要一行行读取后再读取另一个存储用户昵称的txt文件，判断昵称是否有重复，如果没有重复就将数据库中的当前uid用户的昵称......
用Python解决预测问题_对数线性模型模板
对数线性模型（Log-linearmodel）是统计学中用于分析计数数据或频率数据的一类模型，特别是在多维列联表（contingencytables）分析中非常常见。这种模型通过取对数将乘法关系转换为加法关系，从而简化了数据分析。在对数线性模型中，我们通常对观测频数的对数进行建模，模型的形式可以表示......
llamafile本地安装配置并部署及远程测试大语言模型详细实战教程
......
C++奇迹之旅：深度解析list的模拟实现
文章目录......
CohereForAI更新企业级开源模型 c4ai-command-r-08-2024和c4ai-command-r-plus-08-202
C4AICommandR08-2024是一个350亿参数高性能生成模型的研究版本。CommandR08-2024是一个大型语言模型，采用开放式权重，针对推理、总结和问题解答等各种用例进行了优化。CommandR08-2024具备多语言生成功能，曾在23种语言上进行过训练，并在10种语言上进行过评估......
阿里巴巴发布 Qwen2-VL 人工智能模型，具备先进的视频分析和推理能力
中国阿里巴巴集团的云计算部门阿里云周四宣布推出一款名为Qwen2-VL的新型人工智能模型，该模型具有高级视觉理解能力和多语言对话能力。该公司在Qwen-VL人工智能模型的基础上，历时一年研发出了新模型，并表示它可以实现对长度超过20分钟的高质量视频的理解。据阿里巴巴......
Dify大语言模型应用开发平台新手必备：安装注册与私有服务器部署全步骤
Dify简介Dify是一个开源的大语言模型（LargeLanguageModel,LLM）应用开发平台。它融合了后端即服务（BackendasaService,BaaS）和LLMOps的理念，旨在帮助开发者，甚至是非技术人员，能够快速搭建和部署生成式AI应用程序。Dify的主要特点包括：简化开发流程：通过提供一系列工具和服务来简......
240727 深度神经网络
红色是实际数据，绿色是预测的点误差图#-*-coding:utf-8-*-importneurolabasnlimportnumpyasnpimportmatplotlib.pyplotasplt#生成数据min_value=-12max_value=12num_datapoints=90x=np.linspace(min_value,max_value,num_datapoints)y=2......
处理springboot使用fastJson浏览器调用接口正常返回数据却中文乱码的问题
处理springboot使用fastJson浏览器调用接口正常返回数据却中文乱码的问题这属于fastJson的一个bug只需要像下面这样操作就可以了@Bean//使用Bean入fastJsonHttpllessageConvertpublicHttpMessageConverterfastJsonHttpMessageConverters(){//需婴定义......
一个操作系统的设计与实现——第23章快速系统调用
23.1什么是快速系统调用系统调用是操作系统为3特权级任务提供服务的一种手段。在32位操作系统中，我们通过中断实现了系统调用。由于系统调用是一个使用非常频繁的机制，且中断也不是专门为系统调用设计的，因此，64位CPU提供了系统调用的专用机制：快速系统调用。快速系统调用由专用的sy......