- 2024-11-20DISCOVERYBENCH: Towards Data-Driven Discovery with Large Language Models
本文是LLM系列文章,针对《DISCOVERYBENCH:TowardsData-DrivenDiscoverywithLargeLanguageModels》的翻译。DISCOVERYBENCH:使用大型语言模型实现数据驱动的发现摘要1引言2相关工作3公式化4DISCOVERYBENCH5实验6结论摘要使用大型语言模型(LLM)的
- 2024-10-21Towards Explainable Traffic Flow Prediction with Large Language Models
<s>[INST]<<SYS>>Role:Youareanexperttrafficvolumepredictionmodel,thatcanpredictthefuturevolumevaluesaccordingtospatialtemporalinformation.Wewantyoutoperformthetrafficvolumepredictiontask,consideringthenea
- 2024-09-18General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model
摘要传统的OCR系统(OCR-1.0)越来越无法满足人们对智能处理人造光学字符的需求。在本文中,我们将所有人造光学信号(例如,普通文本、数学/分子公式、表格、图表、乐谱,甚至是几何形状)统称为“字符”,并提出了通用OCR理论以及一个优秀的模型,即GOT,以促进OCR-2.0的到来。GOT拥有5.8亿参
- 2024-09-04Towards Robust Blind Face Restoration with Codebook Lookup Transformer(NeurIPS 2022) | Codeformer
TowardsRobustBlindFaceRestorationwithCodebookLookupTransformer(NeurIPS2022)这篇论文试图解决的是盲目面部恢复(blindfacerestoration)问题,这是一个高度不确定的任务,通常需要辅助指导来改善从低质量(LQ)输入到高质量(HQ)输出的映射,或者补充输入中丢失的高质量细节。具体
- 2024-09-01Towards Achieving Asynchronous MPC with Linear Communication and Optimal Resilience
Abstract.Securemulti-partycomputation(MPC)allowsasetofnpartiestojointlycomputeafunctionovertheirprivateinputs.TheseminalworksofBen-Or,CanettiandGoldreich[STOC’93]andBen-Or,KelmerandRabin[PODC’94]settledthefeasibility
- 2024-08-26LogicBench: Towards Systematic Evaluation of Logical Reasoning Ability of Large Language Models
本文是LLM系列文章,针对《LogicBench:TowardsSystematicEvaluationofLogicalReasoningAbilityofLargeLanguageModels》的翻译。LogicBench:大型语言模型逻辑推理能力的系统评价摘要1引言2相关工作3LogicBench4结果和分析5结论局限性摘要最近
- 2024-08-22Towards Mitigating ChatGPT’s Negative Impact on Education: Optimizing Question Design through Bloom’
文章目录题目摘要引言概述实验结果结论和未来工作题目减轻ChatGPT对教育的负面影响:通过布鲁姆分类法优化问题设计论文地址:https://ieeexplore.ieee.org/document/10223662摘要 生成文本AI工具在回答问题方面的流行引发了人们对其可能对学生学业成
- 2024-08-02[paper阅读笔记][2023]CorpusLM: Towards a Unified Language Model on Corpusfor Knowledge-Intensive Tasks
文章链接:https://arxiv.org/pdf/2402.01176v2Paper的任务处理各种知识密集型任务任务的科学问题本文任务虽然是:提出一个统一的语言模型来处理各种知识密集型任务,但其实其本质科学问题是:如何提高LLMs在知识密集型任务中的检索效率。原因是:LLMs在生成文本时容易出现错误信
- 2024-08-01Towards Practical Binary Code Similarity Detection: Vulnerability Verification via Patch Semantic An
"迈向实用的二进制代码相似性检测:通过补丁语义分析进行漏洞验证"0x0Abstruct二进制代码相似性检测方法可以有效地搜索二进制软件中代码共享引入的重复出现的漏洞(1day)。然而,这些方法存在较高的误报率(FPR),因为它们通常将修补的函数视为易受攻击的函数,并且当使用不同的编译设置编译
- 2024-06-12Hungry Hungry Hippos Towards Language Modeling with State Space Models
目录概H3代码FuD.Y.,DaoT.,SaabK.K.,ThomasA.W.,RudraA.andReC.Hungryhungryhippos:towardslanguagemodelingwithstatespacemodels.2022.概Mamba系列第五作:H3.H3感觉H3是之前的linearattention和SSM的一个结合,它所做的只是把line
- 2024-06-11Summary:《Adversarial Machine Learning in Image Classification: A Survey Towards the Defender’s Persp
Note“TaxonomyofAdversarialImages”(Machado等,2023,p.5)(pdf)扰动范围(PerturbationScope):个体扰动(Individual-scopedperturbations):为每个输入图像单独生成的扰动。通用扰动(Universal-scopedperturbations):独立于任何输入样本生成的扰动,可应用于任何合
- 2024-05-28Towards Universal Sequence Representation Learning for Recommender Systems
目录概符号说明UniSRec统一的文本表示统一的序列表示Parameter-EfficientFine-tuning代码HouY.,MuS.,ZhaoW.X.,LiY.,DingB.andWenJ.TowardsUniversalSequenceRepresentationLearningforRecommenderSystems.KDD,2022.概本文提出了一个用text替代ID
- 2024-05-24Mask DINO: Towards A Unified Transformer-based Framework for Object Detection and Segmentation
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布!ProceedingsoftheIEEE/CVFConferenceonComputerVisionandPatternRecognition.2023. Abstract在本文中,我们提出了一个统一的对象检测和分割框架MaskDINO。MaskDINO通过添加一个支持所有图像分割任务(例如
- 2024-05-06AdaZoom: Towards Scale-Aware Large Scene Object Detection 论文解读
《AdaZoom:TowardsScale-AwareLargeSceneObjectDetection》笔记1.研究动机1.1挑战与困难小目标检测和对象尺度差异存在挑战现有研究方法对于大场景中如此极端尺度变化的物体缺乏灵活性,缺乏对不同尺度物体的适应性。1.2解决方案构建了一个自适应缩放网络(简称AdaZoom),对
- 2024-04-07DISTILLM: Towards Streamlined Distillation for Large Language Models
本文是LLM系列文章,针对《DISTILLM:TowardsStreamlinedDistillationforLargeLanguageModels》的翻译。DISTILLM:面向大型语言模型的流线蒸馏摘要1引言2背景3DISTILLM4实验5分析与讨论6相关工作7结论摘要知识蒸馏(KD)被广泛用于将教师模型压缩为
- 2024-03-18[Paper Reading] GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusio
GLIDE:TowardsPhotorealisticImageGenerationandEditingwithText-GuidedDiffusionModelsGLIDE(GuidedLanguagetoImageDiffusionforGenerationandEditing)时间:22/03机构:OpenAITL;DR本文研究使用DiffusionModel做图像生成过程,如何更好地加入conditional信息
- 2024-03-03Towards Foundation Models for Knowledge Graph Reasoning
目录概符号说明ULTRA(amethodforUnified,Learnable,andTRAnsferableKGrepresentations)RelationGraphConstructionConditionalRelationRepresentations代码GalkinM.,YuanX.,MostafaH.,TangJ.andZhuZ.Towardsfoundationmodelsforknowledgegraphrea
- 2023-11-30Towards Reasoning in Large Language Models A Survey
Reasoning定义推理:以逻辑和系统的方式进行思考,利用证据和过往经验来得出结论或作出抉择。演绎推理DeductiveReasoning结论来源于前提假设的阳性前提假设:哺乳动物都有肾脏前提假设:鲸是哺乳动物结论:鲸有肾脏归纳推理InductiveReasoning结论来源于观测或者证据
- 2023-11-23【论文阅读笔记】【OCR-End2End】 ESTextSpotter: Towards Better Scene Text Spotting with Explicit Synergy in Tra
ESTextSpotterICCV2023读论文思考的问题论文试图解决什么问题?场景文本端到端识别任务中,检测和识别两个任务的协同作用十分关键,然而以往的方法通常用一些十分隐式的方式来体现这种协同作用(sharedbackbone,sharedencoder,sharedquery…),不能完全释放这种两个任务相互
- 2023-08-08bigdecimal保留两位小数
bigdecimal保留两位小数1publicclasstest1_format{2publicstaticvoidmain(String[]args){3BigDecimaldecimal=newBigDecimal("1.12345");4System.out.println(decimal);5BigDecimalsetScale=decimal.setScale(4,BigDecimal.ROUND_HALF_DOWN)
- 2023-07-29语音合成技术2:FREEVC: TOWARDS HIGH-QUALITY TEXT-FREE ONE-SHOT VOICE CONVERSION
摘要语音转换(VC)可以通过首先提取源内容信息和目标说话者信息,然后利用这些信息重构波形来实现。然而,目前的方法通常要么提取带有泄漏说话者信息的不完整内容信息,要么需要大量带标注的数据进行训练。此外,由于转换模型与声码器之间的不匹配,重构波形的质量可能会下降。在本文中,我
- 2023-04-22论文解读(PGD)《Towards deep learning models resistant to adversarial attacks》
论文信息论文标题:Towardsdeeplearningmodelsresistanttoadversarialattacks论文作者:AleksanderMadry,AleksandarMakelov,LudwigSchmidt,DimitrisTsipras,AdrianVladu论文来源:ICLR2018论文地址:download 论文代码:download视屏讲解:click1 介绍对抗攻击2
- 2023-02-18新概念2册L33笔记(介词+空间)
L33Outofthedarkness重点词汇explainv.explainsthtosb向某人解释explanationn.stormn.heavystorms暴风雨towardsprep.向、朝、(在空间/时间上接近)strug
- 2023-02-14阅读论文(7)Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks
arXiv:1506.01497参考:FasterRCNN_哔哩哔哩_bilibili初读目前已经了解了目标检测最基础的3个算法:R-CNN、SSPNet和FastR-CNN,后两者都是基于R-CNN的优化,所以说R-CNN是深
- 2023-02-10《Towards Cooperation in Sequential Prisoner’s Dilemmas: a Deep Multiagent Reinforcement Learning App
致力于序贯囚徒困境中的合作:一种多智能体深度强化学习的方法总结主要是针对复杂的序贯囚徒困境的合作提出的方法,目的是为了提高合作程度最终达到提高社会总收益的。该方