首页 > 编程语言 >26,【经典大厂面试题】【连续问题的困难题】Python数分之Pandas训练,力扣,2173. 最多连胜的次数

26,【经典大厂面试题】【连续问题的困难题】Python数分之Pandas训练,力扣,2173. 最多连胜的次数

时间:2024-09-27 18:20:48浏览次数:9  
标签:面试题 01 matches Win 力扣 player 数分 2022 id

  • 学习:知识的初次邂逅
  • 复习:知识的温故知新
  • 练习:知识的实践应用

目录

一,原题力扣链接

二,题干

三,建表语句

四,分析

五,SQL解答

六,验证

七,知识点总结


一,原题力扣链接

. - 力扣(LeetCode)

二,题干

表: Matches

+-------------+------+
| Column Name | Type |
+-------------+------+
| player_id   | int  |
| match_day   | date |
| result      | enum |
+-------------+------+
(player_id, match_day) 是该表的主键(具有唯一值的列的组合)。
每一行包括了:参赛选手 id、 比赛时间、 比赛结果。
比赛结果(result)的枚举类型为 ('Win', 'Draw', 'Lose')。

选手的 连胜数 是指连续获胜的次数,且没有被平局或输球中断。

编写解决方案来计算每个参赛选手最多的连胜数

结果可以以 任何顺序 返回。

结果格式如下例所示:

示例 1:

输入: 
Matches 表:
+-----------+------------+--------+
| player_id | match_day  | result |
+-----------+------------+--------+
| 1         | 2022-01-17 | Win    |
| 1         | 2022-01-18 | Win    |
| 1         | 2022-01-25 | Win    |
| 1         | 2022-01-31 | Draw   |
| 1         | 2022-02-08 | Win    |
| 2         | 2022-02-06 | Lose   |
| 2         | 2022-02-08 | Lose   |
| 3         | 2022-03-30 | Win    |
+-----------+------------+--------+
输出: 
+-----------+----------------+
| player_id | longest_streak |
+-----------+----------------+
| 1         | 3              |
| 2         | 0              |
| 3         | 1              |
+-----------+----------------+
解释: 
Player 1:
从 2022-01-17 到 2022-01-25, player 1连续赢了三场比赛。
2022-01-31, player 1 平局.
2022-02-08, player 1 赢了一场比赛。
最多连胜了三场比赛。

Player 2:
从 2022-02-06 到 2022-02-08, player 2 输了两场比赛。
最多连赢了0场比赛。

Player 3:
2022-03-30, player 3 赢了一场比赛。
最多连赢了一场比赛。

三,建表语句

import pandas as pd

data = [[1, '2022-01-17', 'Win'], [1, '2022-01-18', 'Win'], [1, '2022-01-25', 'Win'], [1, '2022-01-31', 'Draw'], [1, '2022-02-08', 'Win'], [2, '2022-02-06', 'Lose'], [2, '2022-02-08', 'Lose'], [3, '2022-03-30', 'Win']]
matches = pd.DataFrame(data, columns=['player_id', 'match_day', 'result']).astype({'player_id':'Int64', 'match_day':'datetime64[ns]', 'result':'object'})

matches

四,分析

思路

表格分析大法 用啥解答不重要 重要的还是思路和逻辑 表格中把思路和逻辑盘顺, sql或者pandas自然顺手敲来

mysql和pandas完整代码 在最后 不过代码其实不重要,重要的是学会其中的逻辑 和总结规律(方法论);

下次遇到这种题就可以很快解答了

第一步 :开2个排序 分别以player_id分组排序 和游戏id,比赛成绩排序 生成2个序列
第二步:求差值 如果差值相等 则为连续
第三步:以游玩id和差值 分组 聚合胜利的次数 如果是胜利的 if给他1 其余的给0 这样sum就可以拿到连胜次数
第四步:分组求top1呗 每个参赛选手最多的连胜数。
第五步:最后按照题目要求排序

其实汇合起来就是2个步骤 详情见 下方图解

  • 第一步 分别分组排序取差值
  • 第二步 分组求top1

 Pandas实现:

第一步排序:

第二步:分别开两个新列

 

第三步:取差值 

第四步,转换一下成绩列 方便我们一会儿sum 

第五步,取指定的列 

第六步 以id,成绩,差值分组 统计次数 

第七步,取最大值 

第八步 改名 

 

五,SQL解答

import pandas as pd

def longest_winning_streak(matches: pd.DataFrame) -> pd.DataFrame:
    # 对原表进行排序
    matches = matches.sort_values(['player_id','match_day'])
    # 开两个新的排序  第一个排序
    matches['rn'] =matches.groupby(['player_id'])['match_day'].rank(method='first',ascending=True)
    # 开两个新的排序  第二个排序
    matches['rn1'] =matches.groupby(['player_id','result'])['match_day'].rank(method='first',ascending=True)
    #取差值
    matches['diff'] = matches['rn'] - matches['rn1']
    
    # 把result列转换一下 胜利的为1 其他的为0  这样方便我们sum
    matches['res'] = matches['result'].apply(lambda x:1 if x=='Win' else 0)
    df = matches[['player_id','result','diff','res']]
    
    df1 = df.groupby(['player_id','result','diff']).sum().reset_index()
    # df1
    
    df2 = df1.groupby(['player_id'])['res'].max().reset_index()
    df3 = df2.rename(columns={'res':'longest_streak'})
    
    return df3
longest_winning_streak(matches)

六,验证

七,知识点总结

  • Pandas排序的运用 API:sort_values
  • Pandas中开新列的运用 相当于sql中的 row_number用法 API groupby....rank
  • Pandas中自定义函数的运用 apply
  • python中的三目运算符运用
  • python中的匿名函数的运用 lanbda
  • Pandas中求和的运用
  • Pandas中重新生成索引的运用 API reset_index()
  • Pandas中多列分组 求最大值的运用 max
  • Pandas中改名的运用
  • 经典的连续问题  先求差值 在根据差值分组 根据需求做各种下一步运算

  • 学习:知识的初次邂逅
  • 复习:知识的温故知新
  • 练习:知识的实践应用

标签:面试题,01,matches,Win,力扣,player,数分,2022,id
From: https://blog.csdn.net/qq_55006020/article/details/142595881

相关文章

  • 【Kubernetes】常见面试题汇总(四十二)
    目录96.Kubernetes体系结构有哪些不同的组成部分?97.您能否简要介绍一下Kubernetes中主节点的工作?特别说明:题目  1-68  属于【Kubernetes】的常规概念题,即“汇总(一)~(二十二)”。题目69-113属于【Kubernetes】的生产应用题。96.Kubernetes体系结构有哪些......
  • 【Kubernetes】常见面试题汇总(四十一)
    目录94.iptables四个表五个链。95.Kubernetes如何简化容器化部署?特别说明:题目  1-68  属于【Kubernetes】的常规概念题,即“汇总(一)~(二十二)”。题目69-113属于【Kubernetes】的生产应用题。94.iptables四个表五个链。(1)iptables四个表:raw表:确定是否......
  • 【Kubernetes】常见面试题汇总(三十八)
    目录 91.Docker的网络通信模式。特别说明:题目  1-68  属于【Kubernetes】的常规概念题,即“汇总(一)~(二十二)”。题目69-113属于【Kubernetes】的生产应用题。91.Docker的网络通信模式。Docker的4种网络通信模式:1、host模式:-host模式,使用--net=ho......
  • 【Kubernetes】常见面试题汇总(三十五)
    目录 87.简述pod中readiness和liveness的区别和各自应用场景。特别说明:题目  1-68  属于【Kubernetes】的常规概念题,即“汇总(一)~(二十二)”。题目69-113属于【Kubernetes】的生产应用题。87.简述pod中readiness和liveness的区别和各自应用场景。......
  • 负载均衡--相关面试题(六)
    在负载均衡的面试中,可能会遇到一系列涉及概念、原理、实践应用以及技术细节的问题。以下是一些常见的负载均衡面试题及其详细解答:一、什么是负载均衡?回答:负载均衡是一种将网络请求或数据传输工作分配给多个服务器或网络资源的技术,旨在优化资源使用、提高吞吐量、减少响应时......
  • 面试经典 150 题:力扣88. 合并两个有序数组
    每周一道算法题启动题目【题目链接】【解法一】合并后排序排序后的数组自动省略0的数字,又学到了classSolution{public:voidmerge(vector<int>&nums1,intm,vector<int>&nums2,intn){//合并两个数组后排序for(inti=0;i<n;i++)......
  • Redis常见面试题
    过期删除策略删除达到过期时间的key。1)定时删除对于每一个设置了过期时间的key都会创建一个定时器,一旦到达过期时间就立即删除。该策略可以立即清除过期的数据,对内存较友好,但是缺点是占用了大量的CPU资源去处理过期的数据,会影响Redis的吞吐量和响应时间。2)惰性删除当......
  • 【春秋招必看】Unity相关笔试面试题(内有完整答案)第五期
    欢迎来到光光的奇妙冒险,我是你们的煎饼光子老师。今天是我们的第五期笔试面试题总结。C#部分:1、以上代码,谁的效率更高?为什么?答案:代码2的效率更高因为List的本质是数组,在初始化时,如果不默认为其指明分配多少容量,它会不断扩容扩容会带来效率的降低和垃圾的产生效率的降......
  • 前端面试题(十)
    51.前端性能优化在前端开发中,性能优化是面试中的一个常见话题。面试官通常会希望候选人具备识别性能瓶颈并提出相应解决方案的能力。以下是一些常见的前端性能优化面试题及其答案。1.前端性能优化有哪些常见手段?前端性能优化的手段可以从多个维度考虑,主要包括:减少HT......
  • 并发编程面试题
    在java中守护线程和本地线程区别用户线程是程序创建的线程。由jvm创建的线程是守护线程,比方说垃圾收集线程。死锁与活锁的区别,死锁与饥饿的区别?死锁:是指两个或两个以上的进程(或线程)在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力作用,它们都将无法推进下......