首页 > 其他分享 >Microsoft GraphRAG: Token使用量とコストの簡易分析

Microsoft GraphRAG: Token使用量とコストの簡易分析

时间:2024-12-26 16:30:23浏览次数:5  
标签:Search GraphRAG Text 簡易 Token 使用量 Microsoft

Microsoft GraphRAG: Token使用量とコストの簡易分析

背景

Microsoft GraphRAGは、LLM(Large Language Model)を利用する際のToken消費量が重要であることはよく知られていますが、実際にどれくらいのTokenが使用されるのかは明確ではありません。

本記事では、サンプルテキストを基にMicrosoft GraphRAGの処理におけるToken使用量とコストを分析し、その結果を共有します。

前提条件

Microsoft GraphRAGでは、以下の要素がToken使用量に影響を与えます。

  • テキストのChunk分割方法
  • 抽出するエンティティ・タイプの定義
  • Promptの設定
    • Entity Extraction Prompt
    • Summarize Descriptions Prompt
    • Community Report Prompt

本記事の結果は、標準的な設定を反映したものではなく、一例としてご参照ください。

また、分析には Langfuse を利用し、Token使用量やコストを可視化しています。


サンプルテキスト

以下の文章を用いて分析を行いました。

元宇宙科学開発機構の研究員で、ロケットの打ち上げ失敗の責任をとって辞職し、現在は父親が遺した下町の工場「佃製作所」で経営者として第二の人生を送っている 佃航平(阿部寛)。一度はあきらめかけた佃の夢であったロケット製造を、自社が開発したバルブシステムを使用し、日本を代表する大企業・帝国重工の純国産ロケット開発計画「スターダスト計画」により実現するなど、順調な佃製作所だったが…。
ある日、帝国重工の社長交代により、スターダスト計画は次回で終わるかもしれない――と帝国重工宇宙航空開発部部長の 財前(吉川晃司) から告げられ、佃はショックを受ける。ロケット製造に関わることは佃の夢であるとともに、今や「ロケット品質」を掲げる佃製作所社員たちの精神的支柱にもなっていたのだ。
そこへ追いうちをかけるように、大口取引先の農機具メーカーから小型エンジンの取引削減を告げられる。性能よりもコスト重視という考えに、技術力が売りの佃製作所は存在意義が揺らぎ始め、佃は強い危機感を抱く。
そんな中、佃製作所の経理部長・殿村(立川談春)の父親が倒れる。殿村の実家は三百年続く農家。父親の看病と畑仕事の手伝いに、週末ごとに帰省する殿村を見舞う佃と 山崎(安田顕)。トラクターを運転する殿村をじっと見て、佃はあることに気づく。それは、佃の中に新たな夢が生まれた、瞬間だった──。

Chunk分割方法

chunks:
  size: 384
  overlap: 0

抽出するエンティティ・タイプ

- person
- technology
- mission
- organization
- location

使用するLLMとコスト設定

  • OSS LLMを使用
  • 単価は gpt-4 および text-embedding-3-large のPricingに基づいて算出

image.png

image.png


分析結果

1. Create Base Text Units

  • 分割されたChunk数:2
  • 合計Token数:577

Base Text Units


2. Extract Graph

  • 抽出されたEntity数:12
  • 抽出されたRelationship数:16
  • 使用したToken数: 16.43K
  • コスト: $0.57987

Extract Graph

image.png


3. Create Final Community Reports

  • 作成されたReport数:2
  • 使用したToken数: 7.83K
  • コスト: $0.28281

Final Community Reports


4. Generate Text Embeddings

  • 使用したToken数: 3K
  • コスト: $0.00039

Generate Text Embeddings


5. Global Search

  • 使用したToken数: 3.74K
  • コスト: $0.12837

Global Search


6. Local Search

  • 使用したToken数: 5.26K+12
  • コスト: $(0.17133+0.000002)

image.png


まとめ

ステップ使用Token数コスト ($)その他情報
分割 (Base Text Units)N/AN/A分割されたChunk数:2, 合計Token数:577
抽出 (Extract Graph)16.43K0.57987抽出されたEntity数: 12, Relationship数: 16
レポート生成 (Final Community Reports)7.83K0.28281作成されたReport数: 2
テキスト埋め込み (Generate Text Embeddings)3K0.00039N/A
グローバル検索 (Global Search)3.74K0.12837N/A
ローカル検索 (Local Search)5.26K+120.17133+0.000002N/A
合計36.26K+121.16244N/A

本記事では、Microsoft GraphRAGを用いたIndexおよびSearch処理におけるToken使用量とコストを可視化しました。結果はあくまで一例であり、設定やデータにより誤差が生じる可能性があります。

これからGraphRAGの導入を検討されている方の参考になれば幸いです。

标签:Search,GraphRAG,Text,簡易,Token,使用量,Microsoft
From: https://blog.csdn.net/engchina/article/details/144743091

相关文章

  • 微信四种access_token
    网页静默授权access_token作用:网页授权access_token有效期:7200ms原理:微信网页授权是通过OAuth2.0机制实现的,在用户授权给公众号后,公众号可以获取到一个网页授权特有的接口调用凭证(网页授权access_token),通过网页授权access_token可以进行授权后接口调用,如获取用户基本信......
  • Tiktoken Tutorial: OpenAI's Python Library for Tokenizing Text
    tiktokenhttps://github.com/openai/tiktokentiktokenisafastBPEtokeniserforusewithOpenAI'smodels.tiktokentiktokenisafastBPEtokeniserforusewithOpenAI'smodels.importtiktokenenc=tiktoken.get_encoding("o200k_base&quo......
  • 微软 GraphRAG 构建武松打虎的知识图谱 - 超简单教程,小学生都能学会!
    微软GraphRAG构建武松打虎的知识图谱-超简单教程,小学生都能学会!0.引言1.创建组2.读取文件3.创建组和文件的关联4.选择语言和设置实体类型5.设置LLM6.设置Langfuse7.创建基础文本单元8.创建最终文档9.抽取实体和关系10.社区检测11.创建最终实体12.创建......
  • 用pandas读取MRPC数据库时报错:pandas.errors.ParserError: Error tokenizing data. C
    读取的代码很简单,如下:data_path='MRPC/msr_paraphrase_test.txt'df=pd.read_csv(data_path,sep='\t',encoding='utf-8')困扰了一下午,最后本来不打算解决了。想着直接跳过错误,即:df=pd.read_csv(data_path,sep='\t',encoding='utf-8',on_......
  • OAuth2.0中刷新令牌(Refresh Token)的作用
    来着ChatGPT:1.为什么需要刷新令牌?访问令牌的短有效期:访问令牌(AccessToken)通常设置短有效期(例如几分钟到几小时),以减少令牌被盗用后产生的安全风险。令牌过期后,客户端需要一种方式重新获取新的访问令牌,以继续访问受保护资源。避免频繁授权:如果每次访问令牌过期后都需要......
  • C#中 CancellationTokenSource的妙用
    在.NET中,CancellationTokenSource、CancellationToken和Task是处理异步操作和取消任务的重要工具。本文将通过一些简单的例子,帮助你理解它们的用法和协作方式。CancellationTokenSourceCancellationTokenSource是一个取消操作的触发器。它用于生成和管理CancellationToken,并控......
  • 了解OpenAi API key 和 Token
    了解OpenAIAPlkey和Token访问OpenAl的服务的方式有两种,第一种是通过ChatGPT页面访问,第二种是通过API访问。通过API访问时,我们就要关注如何获取使用APIkey,以及了解大模型的计费单元Token。OpenAIAPIkeyOpenALAPIkev是一个唯一标识符,允许开发人员通过API访问OpenA!的模型。A......
  • Js 获取token 过期时间
    functiongetJwtExpiration(token){try{constbase64Url=token.split('.')[1];//提取payload部分constbase64=base64Url.replace(/-/g,'+').replace(/_/g,'/');//Base64Url转换为Base64constjsonPa......
  • VOLTE网络中SIP消息的registration-token参数
    在VOLTE网络中,通信业务标识(Feature-CapabilityIndicator,或者字面翻译成“特性能力指示符”)是经常出现在SIPHeader中的一个参数,其取值和说明可参见3GPPTS24.237。这里简要介绍其中之一的g.3gpp.registration-token(在SIPHeader的Contact域出现时也被称作mediafeaturetag[媒......
  • 最大的顶级数据集开源,HuggingFace排名第一,可创建15万亿Token_全球最大 ai开源 训练数
    去年12月,生成式AI公司Petuum以及穆罕默德·本·扎耶德人工智能大学(MBZUAI)共同推出了一个用于创建开源大型语言模型的项目LLM360,旨在提高开源代码的透明度,公开整个LLM训练过程、代码、数据和最佳实践,以帮助开发人员更轻松、更快捷、更经济地创建开源大型语言模型,实......