首页 > 编程语言 >C# 霍夫曼解码

C# 霍夫曼解码

时间:2024-06-23 10:27:56浏览次数:3  
标签:编码 C# Huffman 解码 HuffmanNode minHeap 霍夫曼 root public

Huffman Tree 进行解码 示例图  

c语言:c语言 霍夫曼编码 | 贪婪算法(Huffman Coding | Greedy Algo)_霍夫曼的贪婪c语言-CSDN博客

c++:c++ 霍夫曼编码 | 贪婪算法(Huffman Coding | Greedy Algo)_霍夫曼的贪婪算法设计核心代码-CSDN博客

c#:C# 霍夫曼编码 | 贪婪算法(Huffman Coding | Greedy Algo)-CSDN博客

c++ STL:c++ STL 霍夫曼编码 | 贪婪算法(Huffman Coding | Greedy Algo)-CSDN博客

java:java 霍夫曼编码 | 贪婪算法(Huffman Coding | Greedy Algo)-CSDN博客

python:python 霍夫曼编码 | 贪婪算法(Huffman Coding | Greedy Algo)-CSDN博客

javascript:JavaScript 霍夫曼编码 | 贪婪算法(Huffman Coding | Greedy Algo)-CSDN博客

我们在之前的文章中 讨论了霍夫曼编码。在这篇文章中,我们将讨论解码。

例子:

输入数据: AAAAAABCCCCCCDDEEEEE
频率: A:6,B:1,C:6,D:2,E:5

编码数据: 00000000000011001010101010111111110101010

哈夫曼树: “#”是用于内部节点的特殊字符,因为
                         内部节点不需要字符字段。 

                    #(20)
                  / \
          #(12) #(8)
         / \ / \
     A(6) C(6) E(5) #(3)
                                 / \
                             B(1) D(2)  

‘A’ 的代码是 ‘00’,‘C’ 的代码是 ‘01’,..

解码数据: AAAAAAABCCCCCCDDEEEEE

输入数据: GeeksforGeeks

字符 频率为
e 10, f 1100, g 011, k 00, o 010, r 1101, s 111

编码的哈夫曼数据: 01110100011111000101101011101000111
解码的哈夫曼数据: geeksforgeeks

请按照以下步骤解决问题:

        注意:要解码编码数据,我们需要霍夫曼树。我们遍历二进制编码数据。要找到与当前位对应的字符,我们使用以下简单步骤:

        1、我们从根开始,依次进行,直到找到叶子。
        2、如果当前位为 0,我们就移动到树的左节点。
        3、如果该位为 1,我们移动到树的右节点。
        4、如果在遍历过程中遇到叶节点,我们会打印该特定叶节点的字符,然后再次从步骤 1 开始继续迭代编码数据。

        下面的代码将一个字符串作为输入,对其进行编码,并将其保存在变量编码字符串中。然后对其进行解码并打印原始字符串。 

下面是上述方法的实现:

using System;
using System.Collections.Generic;
using System.Linq;
 
namespace HuffmanEncoding
{
    // To store the frequency of character of the input data
    class FrequencyTable
    {
        private readonly Dictionary<char, int> _freq = new Dictionary<char, int>();
 
        public void Add(char c)
        {
            if (_freq.ContainsKey(c))
            {
                _freq++;
            }
            else
            {
                _freq = 1;
            }
        }
 
        public Dictionary<char, int> ToDictionary()
        {
            return _freq;
        }
    }
 
    // A Huffman tree node
    class HuffmanNode : IComparable<HuffmanNode>
    {
        public HuffmanNode Left { get; set; }
        public HuffmanNode Right { get; set; }
        public char Data { get; set; }
        public int Frequency { get; set; }
 
        public HuffmanNode(char data, int freq)
        {
            Data = data;
            Frequency = freq;
        }
 
        // Define the comparison method for sorting the nodes in the heap
        public int CompareTo(HuffmanNode other)
        {
            return Frequency - other.Frequency;
        }
    }
 
    // Utility class for creating Huffman codes
    class HuffmanEncoder
    {
        // To map each character its Huffman value
        private readonly Dictionary<char, string> _codes = new Dictionary<char, string>();
 
        // Create an empty min-heap
        private readonly List<HuffmanNode> _minHeap = new List<HuffmanNode>();
 
        // Function to build the Huffman tree and store it in minHeap
        private void BuildHuffmanTree(Dictionary<char, int> freq)
        {
            foreach (var kvp in freq)
            {
                _minHeap.Add(new HuffmanNode(kvp.Key, kvp.Value));
            }
            // Convert the list to a min-heap using the built-in sort method
            _minHeap.Sort();
            while (_minHeap.Count > 1)
            {
                var left = _minHeap.First();
                _minHeap.RemoveAt(0);
                var right = _minHeap.First();
                _minHeap.RemoveAt(0);
                var top = new HuffmanNode('$', left.Frequency + right.Frequency);
                top.Left = left;
                top.Right = right;
                _minHeap.Add(top);
                // Sort the list to maintain the min-heap property
                _minHeap.Sort();
            }
        }
 
        // Utility function to store characters along with their Huffman value in a hash table
        private void StoreCodes(HuffmanNode root, string str)
        {
            if (root == null)
            {
                return;
            }
            if (root.Data != '$')
            {
                _codes[root.Data] = str;
            }
            StoreCodes(root.Left, str + "0");
            StoreCodes(root.Right, str + "1");
        }
 
        // Utility function to print characters along with their Huffman value
        public void PrintCodes(HuffmanNode root, string str)
        {
            if (root == null)
            {
                return;
            }
            if (root.Data != '$')
            {
                Console.WriteLine(root.Data + " : " + str);
            }
            PrintCodes(root.Left, str + "0");
            PrintCodes(root.Right, str + "1");
        }
 
        // Function iterates through the encoded string s
        // If s[i] == '1' then move to node.right
        // If s[i] == '0' then move to node.left
        // If leaf node, append the node.data to our output string
        public string DecodeFile(HuffmanNode root, string s)
        {
            
            string ans = "";
            HuffmanNode curr = root;
            int n = s.Length;
            for (int i = 0; i < n; i++)
            {
                if (s[i] == '0')
                {
                    curr = curr.Left;
                }
                else
                {
                    curr = curr.Right;
                }
 
                // Reached leaf node
                if (curr.Left == null && curr.Right == null)
                {
                    ans += curr.Data;
                    curr = root;
                }
            }
            return ans + "\0";
        }
 
        // Function to build the Huffman tree and store it in minHeap
        public void BuildCodes(Dictionary<char, int> freq)
        {
            BuildHuffmanTree(freq);
            StoreCodes(_minHeap.First(), "");
        }
 
        public Dictionary<char, string> GetCodes()
        {
            return _codes;
        }
 
        public HuffmanNode GetRoot()
        {
            return _minHeap.First();
        }
    }
 
    class Program
    {
        static void Main(string[] args)
        {
            // Driver code
            string str = "geeksforgeeks";
            string encodedString = "";
            string decodedString;
            var freqTable = new FrequencyTable();
            foreach (char c in str)
            {
                freqTable.Add(c);
            }
            var huffmanEncoder = new HuffmanEncoder();
            huffmanEncoder.BuildCodes(freqTable.ToDictionary());
            Console.WriteLine("Character With their Frequencies:");
            foreach (var kvp in huffmanEncoder.GetCodes())
            {
                Console.WriteLine($"{kvp.Key} : {kvp.Value}");
            }
 
            foreach (char c in str)
            {
                encodedString += huffmanEncoder.GetCodes();
            }
 
            Console.WriteLine("\nEncoded Huffman data:");
            Console.WriteLine(encodedString);
 
            // Function call
            decodedString = huffmanEncoder.DecodeFile(huffmanEncoder.GetRoot(), encodedString);
            Console.WriteLine("\nDecoded Huffman Data:");
            Console.WriteLine(decodedString);
        }
    }

输出:
具有以下频率的字符:

e 10
f 1100
g 011
k 00
o 010
r 1101
s 111

编码的哈夫曼数据:
01110100011111000101101011101000111

解码的哈夫曼数据:
geeksforgeeks

时间复杂度:

        霍夫曼编码算法的时间复杂度为O(n log n),其中n为输入字符串的字符个数。辅助空间复杂度也是O(n),其中n为输入字符串的字符个数。

        在给定的C#代码实现中,时间复杂度主要由使用优先级队列创建 Huffman 树决定,这需要 O(n log n) 时间。空间复杂度主要由用于存储字符频率和代码的映射决定,这需要 O(n) 空间。用于打印代码和存储代码的递归函数也增加了空间复杂度。

比较输入文件大小和输出文件大小: 
        比较输入文件大小和霍夫曼编码的输出文件。我们可以用一种简单的方法计算输出数据的大小。假设我们的输入是一个字符串“geeksforgeeks”,存储在文件 input.txt 中。 

输入文件大小:

输入: “geeksforgeeks”
字符总数即输入长度:13
大小: 13 个字符出现次数 * 8 位 = 104 位或 13 个字节。

输出文件大小:

输入: “geeksforgeeks”

——————————————————
字符 | 频率 | 二进制哈夫曼值 |
——————————————————

   e | 4 | 10 |
   f | 1 | 1100 |   
   g | 2 | 011 |
   k | 2 | 00 |
   o | 1 | 010 |
   r | 1 | 1101 |
   s | 2 | 111 | 

—————————————————

因此要计算输出大小:

e:出现 4 次 * 2 位 = 8 位
f:出现 1 次 * 4 位 = 4 位
g:出现 2 次 * 3 位 = 6 位
k:出现 2 次 * 2 位 = 4 位
o:出现 1 次 * 3 位 = 3 位
r:出现 1 次 * 4 位 = 4 位
s:出现 2 次 * 3 位 = 6 位

总和: 35 位,约 5 字节

        由此可见,编码后的数据量是比较大的,上面的方法也可以帮我们确定N的值,也就是编码后数据的长度。 

标签:编码,C#,Huffman,解码,HuffmanNode,minHeap,霍夫曼,root,public
From: https://blog.csdn.net/hefeng_aspnet/article/details/139590544

相关文章

  • 647. 回文子串(leetcode)
    647.回文子串(leetcode)题目描述给你一个字符串s,请你统计并返回这个字符串中回文子串的数目。回文字符串是正着读和倒过来读一样的字符串。子字符串是字符串中的由连续字符组成的一个序列。示例1输入:s=“abc”输出:3解释:三个回文子串:“a”,“b”,“c”......
  • Lightroom Classic 2023 for Mac(摄影后期图像编辑工具) v12.4版
    lightingClassic是Adobe公司推出的一款图像处理软件,是数字摄影后期制作的重要工具之一。与其他图像处理软件相比,LightroomClassic具有以下特点:LightroomClassic2023forMac(摄影后期图像编辑工具)软件地址高效的图像管理:LightroomClassic提供了强大的图像管理功能,可以......
  • Navicat Premium for Mac(多协议数据库管理工具) 16.3.4版
    NavicatPremium16是一款功能强大的跨平台数据库管理工具,支持多种数据库类型,如MySQL、MariaDB、Oracle、SQLite、PostgreSQL等等。它提供了丰富的数据库管理功能和工具,可以帮助开发人员和数据库管理员快速地创建、管理和维护数据库。NavicatPremiumforMac(多协议数据库管......
  • Redis Desktop Manager for Mac(Redis桌面管理工具) v2022.5.0中文版
    RedisDesktopManagerforMac是Mac平台上一款非常实用的Redis可视化工具。RDM支持SSL/TLS加密,SSH隧道,基于SSH隧道的TLS,为您提供了一个易于使用的GUI,可以访问您的Redis数据库并执行一些基本操作:将键视为树,CRUD键,通过shell执行命令。RedisDesktopManagerforMac(Redis桌......
  • 66Uptime – 网站服务器 & Cronjob 监控工具 v35.0.0扩展中文版安装
    66Uptime是一款自托管、易于使用、轻量级且高性能的网站服务器和Cronjob监控工具。以其丰富的功能和便捷的管理方式,为用户提供了全方位的网站服务器和Cronjob监控解决方案:主要功能:监控网站服务器和Cronjob的运行状态,确保它们持续稳定运行。提供从多个位置检查显示器的功......
  • C语言之字符处理函数
    目录1字符处理函数1.1检查型函数1.1.1检查字符是字母或数字isalnum1.1.2检查字符是否是字母isalpha1.1.3检查字符是否是ASCII码isascii1.1.4检查字符是否是控制字符iscntrl1.1.5检查字符是否是数字字符isdigit1.1.6检查字符是否是可打印字符(不含空格)isgraph1.1.7检查字......
  • Transformer细节(五)——详解Transformer解码器的自注意力层和编码器-解码器注意力层数
    一、自注意力层(Self-AttentionLayer)并行处理目标序列        自注意力层的任务是计算输入序列中每个位置之间的关系,并生成每个位置的表示。这一过程可以并行处理,因为它并不依赖于前一个位置的计算结果。自注意力机制的具体步骤1.输入嵌入与位置编码      ......
  • Python中的交互式GUI开发:与MATLAB uicontrol的比较
    Python中的交互式GUI开发Python中的交互式GUI开发:与MATLABuicontrol的比较**PythonGUI开发库****Tkinter****PyQt/PySide****与MATLAB的比较****总结**Python中的交互式GUI开发:与MATLABuicontrol的比较在MATLAB中,uicontrol是一个强大的功能,用于创建用户界面控......
  • 【HDC 2024】华为云开发者联盟驱动应用创新,赋能开发者成长
    本文分享自华为云社区《【HDC2025】华为云开发者联盟驱动应用创新,赋能开发者成长》,作者:华为云社区精选。6月21日到23日,华为开发者大会(HDC2024)于东莞松山湖举行,这里有丰富多样的主题演讲、峰会、专题论坛和互动体验,数百场面向开发者的特色活动,汇聚璀璨星光、激发创新灵感……6......
  • 【图文】BP神经网络与深度学习CNN的关系
    本文来自《老饼讲解-BP神经网络》https://www.bbbdata.com/目录一、BP神经网络网络是什么二、BP神经网络用于图象识别问题1.1.BP神经网络解决图象识别问题1.2.BP神经网络解决图象识别问题的困难三、从BP到CNN深度学习模型BP神经网络是一个经典、有效的算法,即使时至今日,在传统......