首页 > 其他分享 >2024-08-27 闲话

2024-08-27 闲话

时间:2024-08-27 23:05:19浏览次数:4  
标签:27 users 08 solution dataset 2024 state action GUI

用户行为建模是一个非常非常有趣的事情。从这六个字,你就可以联想到,我点点这里划划那里,你怎么就能知道我在干什么呢?今天突然想到除了 user 的 action 之外,我们其实还有屏幕的显示信息。

今天读到一篇文章,讲 Identifying User Goals from UI Trajectories。这个名字一下子就激起了我的好奇心,从 abstract 跟着一起思考了一下,非常有趣的体验!

我们有很多 GUI control 的 dataset。这些 dataset 中有不同的 task 和 solution。 solution又包括从 initial state 不断做动作(take actions)得到 final state 的 trajectory,但是这里的 trajectory 只有 state & action 没有 reward。state 在 GUI 这个 setting 里面就可以是一个屏幕截图,毕竟人在手机上进行操作的时候也就是有一个 intention,有 common sense,看到手机屏幕现在是什么样的,然后做出动作。

这些 GUI control dataset 有什么用呢?我们可以反过来,把 solution 当做 用户 action,我们去预测 task description。

但是它评估两个 output & std等价用的是 hand craft + prompt gpt,非常唐。

限制:
(1) user trajectories may be interleaved between multiple tasks as
users adjust their objectives in real time or are interrupted by other tasks
(2) users might have more ambiguous goals that evolve during their interaction with the user interface
(3) users might be less proficient with computers or phones, leading to noisier trajectories that are more challenging to identify and interpret intent from.

感觉自己在读到 aitw 的时候就意识到它这个实验只在 toy 上做了。


这东西有啥用啊?

我们希望未来的 agent 可以无所不能,比如你搜过 nihon 的各种地点,在飞书文档里面写了一堆粗粒度规划,又打开 booking.com,那么我们的 agent 就应该结合你的 income 给你推荐酒店啦。

标签:27,users,08,solution,dataset,2024,state,action,GUI
From: https://www.cnblogs.com/yspm/p/18383682/WasteWords20240827

相关文章

  • pytorch常见错误_0240826
    pytorch常见错误RuntimeError:aleafVariablethatrequiresgradisbeingusedinanin-placeoperation.如下程序会抱上述错误x=torch.randn(3,requires_grad=True)x+=1#原位操作报错:RuntimeError:aleafVariablethatrequiresgradisbeingusedinan......
  • Astar2024 游寄
    初赛打得第\(3\)场。link。省流:\(6\)题,rk35,没过F,输麻了。过题顺序是A->D->B->C->E->G->(F)。F没调完。简要sol:A:过题时间:00:09:08,无罚时。难度:大概1500?二分答案一下,然后没了。复杂度\(\Theta(n\log{v})\)。B:过题时间:00:25:28,一发罚时。罚时原因:数组开小......
  • NOI2024 D1T3 口胡题解
    NOI2024D1T3口胡题解题目条件其实就是说对于点对\((a,b)\),从\(a\)到\(b\)的路径上至少要有一条从\(b\)指向\(a\)​的边。将初始状态记作\((T,S)\)​,其中\(T\)​是树,\(S\)​是二元组\((a,b)\)​的集合。注意到特殊性质A蕴含了:如果对于所有二元组\((a,b)\),\(a......
  • 2024.8.27
    DATE#:20240827ITEM#:DOCWEEK#:TUESDAYDAIL#:捌月廿肆TAGS<BGM="Dragonflame--KiraraMagic"><theme=oi-contest><theme=oi-datastructureSegment><[空]><[空]>```渊沉鳞潜,冻血锈骨闭魂眼;披风游焰,穿峡掠谷骋日月。```......
  • 2024吴恩达机器学习
    一、机器学习的应用1.监督学习(回归与分类)2.无监督学习(聚类、异常检测、降维)3.线性回归模型f(x)=wx+b代价函数costfunction: objective minimizeJ(w,b)4.梯度下降w=w-@d/dwJ(w,b)b=b-@d/dbJ(w,b) 学习率@的影响toosmall toobig 4.线性回归中的梯度......
  • 2024
    在docker中分别以后台方式和交互方式启动centos,对比启动后的容器状态,实现退出容器也能保持其运行状态。在docker并部署DVWA,要求:DVWAweb端口映射到8082,提供访问截图。3、Mysql练习(1)创建一个名为"magedu_C10"的数据库;(2)在magedu_C10数据库中创建一张名为"table_Sec"的表,要求有序号......
  • 2024.8 #7
    1.[TJOI2015]弦论你说得对,但是小S觉得SAM非常的不优美,所以她打算使用SA做。她决定先研究\(t=0\)的情况。从头到尾扫,每一个后缀没出现过的子串数为是\(n-sa_i+1-hight_i\)。然后就可以直接枚举每一个位置,然后就可以计算出第\(k\)个子串的结尾在哪里。然后......
  • 8.27 模拟赛(2019 CSP-S 真题)
    省流:预计\(40+0+15+0\),实际\(35+4+15+0\)。比赛复盘开局浏览题。A没太看懂(廊桥是什么?机场里有这玩意?);B题很好读懂,但没思路;C括号序列感觉可做;D一眼不会。除C外都感觉没太有戏。顺序开题。看懂A后,分析了一段时间后忘记了题面中“先到先得”的原则,导致推到一些歪的贪心浪......
  • .NET周刊【8月第4期 2024-08-25】
    国内文章从控制台开始关联Win2D和WinUI3应用https://www.cnblogs.com/lindexi/p/18378612本文将告诉大家如何从最简单的控制台开始搭建,让Win2D和WinUI3关联起来,让Win2D可以将内容渲染到WinUI3应用上。为何Thread.Sleep半毫秒和一毫秒等待时间差距如此之大h......
  • 大模型日报 2024-08-27
    大模型日报2024-08-27大模型资讯视觉语言基础模型生成逼真胸部X光图像摘要:由于高质量医学影像数据集的匮乏,机器学习模型可以通过生成具有多样性和组合性的胸部X光图像来缓解这一问题。大语言模型中的幻觉现象:挑战与应对摘要:大语言模型(如OpenAI的C......