首页 > 其他分享 >大数据头号大敌是带宽

大数据头号大敌是带宽

时间:2022-12-05 11:05:08浏览次数:36  
标签:头号 带宽 照片 传输 算法 望远镜 大敌 数据


科学家们想在智利高山建立一个天气望远镜,能够以大约1400张照片且每张照片约含有6GB的信息来观察每晚的夜间天空。本月即可建好的大型天气测量望远镜,每年产生的数量级高达数百PB。本月,国家科学委员会将决定是否应该资助下一阶段的LSST建立数据产生的望远镜。


 含有6GB的信息高清晰夜空照片

科学家们并不担心存储或处理所有的数据,但是他们担心如何将利的数据传输到其他地方。在他们看来,这不是大数据的问题,而是传输大数据的宽带的问题。

有建议说,望远镜可以每60秒拍摄两个夜空的照片,然后在白天12小时其不需要捕捉图片时,通过6GB传输速率传出去。该项目计划发布的年度数据分析报告中,包含自然科学中最高分辨率的照片,但这些照片背后的数据每年都要运行多个PB级的信息。

正在兴建新的天气望远镜上,在智利的Cerro Pachon山上。其它收集的图像将在夜间被传输到北美和伊利诺伊大学厄巴纳的香槟分校(NCSA)的国家超级计算机应用中心。这将需要巨额的带宽,但是带宽偏偏是我们这个世界中越来越稀缺的资源。

摩尔定律指出,计算能力每一年半到两年的时间增加一倍。不过,带宽并没有以几乎同样的速度在增加。 坦白说:“大数据的头号大敌就是带宽。无论是哪一种应用,对于大数据而言,都没有足够大的通道来快速移动。”


天文望远镜传输路线图

解决的办法是用两个更宽更快的管道来传输大数据。比如 Globus Online的方案和美国政府Ignite项目都可以使网络建设更为简便。也有一些纯技术方案,比如在Aspera使用的文件传输协议等。但是有更科学和有前途的商业发展的方案,那就是采用更好的算法以减少发送的数据。正如以下内容所说:“算法有助于减少分布式数据的带宽压力,但如何才能减少传输信息量,需要研究。例如,不是将整个原始数据集都传输,科学家可以研发简单的算法,以减少数据更易于管理的规模。算法可以从噪声,消除重复的数据,不断变化的索引信息和目录中分离信号。相比原始数据,这些数据子集在本质上规模较小,因此更容易传输。”

因此,也许在拥挤的网络传输之前预先处理数据,比如重复数据删除等,这样再减少了不必要的数据后,科学家可以收到有关他们研究的唯一的数据集。需要处理大数据的天文项目并非一个,之前作者还介绍过平方千米阵无线电天线项目,都反映了大数据传输的瓶颈——带宽。

而科研人员如果通过研究发现过滤大数据的解决办方案也可以帮到其他行业。比如设计一种数据离群检测算法可以帮助金融机构检测诈骗行为,其他工具可以通过分析商业大数据背后的商机等。

标签:头号,带宽,照片,传输,算法,望远镜,大敌,数据
From: https://blog.51cto.com/u_11295556/5911560

相关文章

  • 带宽的理解
    1M带宽指的是1Mbps,Mbps是Millionbitspersecond的缩写,Mbps=Mbit/s即兆比特每秒,它的意思是时间内传输数据的平均比特数,其单位是比特每秒(bps),或千比特每秒(Kbps),或兆比特......
  • ROS的Fasttrack,可以极大的减少ROS的CPU使用率已经带宽!特别注意:如果开启了 fasttrack,si
    原文http://t.zoukankan.com/itfat-p-12936850.htmlhttps://wiki.mikrotik.com/wiki/Manual:IP/Fasttrack特别注意:如果开启了fasttrack,simplequeue将失效。需要两条......
  • win10 如何查看电脑的网卡带宽是千兆还是百兆
    网卡带宽是这个网卡单位时间内传输数据的最大值。按这个方法(win10如何查看接入的网络是千兆还是百兆-拾月凄辰-博客园)显示的是你现在网卡和路由器之间的连接速度,而并......
  • 码元、波特、速率、带宽
    码元、波特、速率、带宽码元码元是指用一个固定时长的信号波形(数字脉冲),代表不同离散数值的基本波形,是数字通信中数字信号的计量单位,这个时长内的信号称为k进制码元,而该......
  • 服务器上行、下行速度是多少,100M带宽什么概念?
        服务器公网带宽分为上行带宽和下行带宽两个方向;服务器上行带宽是指流量从服务器流出,下行带宽是指流量流入服务器。也就是说,服务器上行带宽对应用户从服务器下载......
  • 噪声与带宽(未学完)
    1.信道噪声1)信道噪声的分类:a.按噪声来源分类:人为噪声、自然噪声、内部噪声(如热噪声)等。b.按噪声性质分类:脉冲噪声、窄带/单频、内部噪声(如热噪声)等。其......
  • HDMI带宽计算
           HDMI接口采用TMDS(TransitionMinimizedDifferentialSignaling最小化传输差分信号)传输技术,采用8b/10b差分信号来降低EMI和提高精确的信号传输速率(关......
  • Linux上查看网络带宽的18个常用命令
    Linux上查看网络带宽的18个常用命令:​按照功能进行划分:​监控总体带宽的使用:nload、bmon、bwm-ng、cbm、speedometer和netload​监控总体带宽的使用(批量式输出):vnstat、ifs......
  • OPNsense设置带宽整形教程
    流量整形,也称为​​packetshaping​​,是一种带宽管理策略,它延迟特定网络数据包的流动,以确保更高优先级应用程序的网络性能。它通常用于确保与业务相关的网络流量获得高水平......
  • win10 怎么看电脑网卡带宽
    右键点击桌面右下角网络图标的“打开网络和"Internet"设置”点击“网络共享中心”在打开的网络共享中心窗口中,点击当前正在连接的网卡。在打开的网卡属性窗口中,就能看到网卡......