• 2024-10-11奇偶数
    #include<stdio.h>intmain(void){ intn; inti=0; while(scanf("%d",&n)!=EOF) { intformer[100000]={1}; intlater[100000]={0}; if(n>2&&n%2==0) { printf("Yes"); } else {
  • 2024-09-24为什么多模态大语言模型最近用BLIP2中Q-Former结构的变少了?
    前言本篇介绍为什么多模态大语言模型(MLLM)最近的工作中用BLIP2中Q-Former结构的变少了?简单来说,相较于MLP的方案,即LLaVA-1.5,BLIP-2中的Q-Former模型在参数量上更为庞大,其收敛过程也相对缓慢。在同等条件下,Q-Former的性能并未达到LLaVA-1.5所展现出的卓越水平。值得注意的是,即使在数据
  • 2024-07-28通配连续性题目解法小结
    把所有经常写到的连续力扣罗列在这,对这种看上去比较复杂的题目总结一个普适性强的解法LeetCode603连续空余座位连续可用座位查找电影院所有连续可用座位,返回值按seat_id升序排列思路:WITHcinema_valid_seatAS(SELECTseat_id,seat_id+1ASnext_num,--5的
  • 2024-06-06BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Mode
    Motivation&Abs端到端大规模视觉语言预训练的开销极大。为此,本文提出了BLIP2,利用现成的冻住的imageencoder以及LLM引导视觉语言预训练。模态差距:通过两阶段训练的轻量级的QueryTransformer(Q-Former)弥补。第一阶段:从冻结的imageencoder引导VL学习;第二阶段:从冻结的LLM引导视