我过去遇到过如何在周期时间小部件中计算平均周期时间的一些问题,因此我决定使用 Python 进行分析,看看是否找到任何方法来计算平均周期时间并获得相同的结果周期时间小部件中显示的值。
我的问题是我无法达到周期时间小部件中显示的相同的平均周期时间值。
你们能帮我解决这个问题吗?|| |在撰写本主题时,周期时间小部件中显示的平均周期时间值为 12 天。
但是,使用 Python、Pandas 并连接 Feed OData API,我从未达到相同的值。我已经达到了 11 天的值,并且使用其他计算方法(例如移动平均线),我已经达到了 9 天或 11 天。我已在帖子中提供了代码。
当使用 Power BI 并与 Feed OData API 连接时(按照此处指示的方式
),我获得的平均周期时间值仍然是 11。 在撰写本主题时,我的目标值为 12 天。 这是我的代码 - 最初是在 Jupyter 笔记本中编写的:
At the time of writing this topic, the value I was targeting were 12 days.
Here’s my code - originally written in a Jupyter notebook:
# %%
import pandas as pd
import requests
import json
import base64
import math
from datetime import datetime, timedelta
# %%
token_do_azure = '{hidden}'
pat_encoded = base64.b64encode((":" + token_do_azure).encode()).decode()
headers = {
'Content-Type': 'application/json',
'Authorization': f'Basic {pat_encoded}'
}
# %%
hoje = datetime.today()
delta = timedelta(days=90)
dia_resultante = hoje - delta
dia_formatado = dia_resultante.strftime('%Y-%m-%dT00:00:00.00000Z')
print(dia_formatado)
url = rf"https://analytics.dev.azure.com/{hidden}/_odata/v4.0-preview/WorkItems?$select=WorkItemId,WorkItemType,Title,CycleTimeDays,ClosedDate&$filter=(Project/ProjectName eq 'Suporte_Torres' AND (WorkItemType eq 'Issue') AND State eq 'Done' AND ClosedOn/Date ge {dia_formatado})"
# %%
req = requests.get(url, headers=headers)
req_tabela = json.loads(req.text)
req_valores = req_tabela["value"]
# %%
df = pd.DataFrame(req_valores)
df['ClosedDate'] = pd.to_datetime(df['ClosedDate'], format='ISO8601').dt.date
# %%
print(round(df['CycleTimeDays'].mean(), 0))
# Returns 11.0, instead of 12.0.
# %%
# The moving average part of the code was written based on the moving average content of this page: https://learn.microsoft.com/en-us/azure/devops/report/dashboards/cycle-time-and-lead-time?view=azure-devops
def calcular_janela_n(n_dias):
n = int(0.2 * n_dias)
n = math.floor(n)
if n % 2 == 0:
n -= 1
if n < 1:
n = 1
return n
janela_n = calcular_janela_n(90)
# %%
df['SMA_n'] = df['CycleTimeDays'].rolling(window=janela_n, min_periods=1).mean()
print(round(df['SMA_n'].tail(1).iloc[0], 0))
# Returns 9.0, instead of 12.0.
print(round(df['SMA_n'].mean(), 0))
# Returns 11.0, instead of 12.0.
在比较从 Python 代码和 Azure DevOps 周期时间小组件获得的平均周期时间结果时,有几个原因可能会导致差异。以下是解决差异的分步指南,以及需要牢记的一些事项:
-
日期范围对齐:
- 确保的 Python 脚本和周期时间小组件使用完全相同的日期范围。 检查小组件中是否应用了任何过滤器,这可能会减少所考虑的工作项数量。
- 时区: 验证 Python 代码和 Azure DevOps 帐户中使用的时区之间是否一致。时区差异可能会导致计算的周期时间出现细微差异。
-
工作项过滤:
- 验证的小组件和 Python 脚本是否使用相同的筛选条件。 周期时间小组件可能包含可以自定义的筛选条件。 确保的 Python 代码复制了这些条件,包括工作项类型、项目、里程碑或任何自定义筛选条件。
- 周末/节假日: Azure DevOps 允许在计算周期时间时配置工作日。 确保的 Python 脚本与这些设置一致。如果 Azure DevOps 配置为排除周末或节假日,需要在 Python 代码中进行相应调整。
-
计算周期时间的逻辑理解:
- Azure DevOps 计算: Azure DevOps 计算周期时间的方式是,从工作项进入“进行中”状态的那一天到其进入“完成”状态的那一天,但不包括在“完成”状态中度过的那一天。
- 复制逻辑: 确保的 Python 代码完全反映了这种计算。
-
处理异常值:
- 识别异常值: 极高的周期时间值(异常值)会极大地影响平均值。 在的 Python 代码和 Azure DevOps 中识别并检查这些异常值。
- 异常值策略: 确定 Azure DevOps 如何处理异常值。它可能完全排除它们、使用不同的平均方法或应用某种形式的平滑处理。在的 Python 分析中调整异常值的处理方式以匹配。
-
移动平均线计算:
- 窗口大小: 虽然 Azure DevOps 的周期时间小组件确实提供了移动平均选项,但确切的实现(窗口大小、加权)可能会有所不同或未明确说明。尝试试验 Python 代码中的窗口大小,以查看它是否与小组件值相符。
-
API 分页:
- 如果的数据集中有大量工作项,则 Azure DevOps API 可能会将结果分页。 确保的 Python 代码从 API 中获取所有页面的数据以包含所有相关的工作项。
调试技巧:
- 从一个较小的数据集开始: 选择一个非常小的工作项集,可以在其中手动验证 Azure DevOps 和 Python 代码中的计算结果。
- 逐步比较: 逐步调整的 Python 代码,每次比较结果,以隔离导致差异的特定部分。
- 记录和日志记录: 添加日志记录语句以捕获 Python 代码中的中间计算和过滤后的数据集大小。这可以帮助查明差异。
代码改进建议:
-
直接日期比较:
与其格式化日期字符串进行比较,不如在 Python 代码中使用
datetime.date
对象进行更可靠的比较。 -
优化 API 查询:
仅请求的分析所需的字段(例如,
WorkItemId
、ClosedDate
、CycleTimeDays
),以减少数据传输并提高性能。
通过系统地解决这些要点,应该能够识别出差异的原因,并使的 Python 代码与 Azure DevOps 周期时间小组件保持一致。
标签:python,azure-devops,powerbi,odata,azure-boards From: 78755022