案例展示

这里有最新的公司动态,这里有最新的网站设计、移动端设计、网页相关内容与你分享!

Dyna创始人注:24小时笔记本电脑背后的AGI视觉?

资料来源:Zhen Fund可以逼真地看明星。这是技术企业家的理想肖像。自从投资DYNA机器人技术以来,我给Lindon,York和Jason的Co -Founders的技术愿景和实践精神留下了深刻的印象。我们团队的同学西·扬(莫尼卡)更加感动加入比赛,并正式宣布他已返回湾区加入Dyna。我们也希望您继续以好奇心探索Avant -Garde技术(但您需要继续为我们录制播客)。今天,我希望与Dyna的共同创始人分享这篇约克文章,以激发您的灵感。享受! Zhen Fund的执行合伙人Dai Yusen Dyna到底是什么?自从启动Dyna-1以来,我接一个地收到了许多问题。在公共社交网络中提到了一些,而在朋友的私人交流中提到了一些。核心关注相同的问题。 dyna与其他公司有什么不同?你在干什么?从一个外部视角,dyna-1的释放是“莫名其妙的”。尽管整个网络都在执行中跳舞人类机器人和马拉松比赛,但我们正在讨论大型模型的机器人,这些机器人可以理解人类的指示并完成多个任务,但我们推出了一个“特殊”的机器人,该机器人反复堆叠了餐巾纸,并允许干燥24小时。 Dyna-1机器人坐着餐巾。这很容易思考。 Dyna是传统的垂直机器人公司吗?像过去的工业机器人一样,我们专注于做一件事,对极端进行做,然后用它赚钱。值得谈论这个问题。在Dyna正式发布之前,他最初认为公众,同事和投资者就机器人开发方向有一定的共识。但是,在发射之后,发现辩论的诺斯“应该是一个机器人”仍在花在大面上,并且处于巨大的差异阶段。今天我为我的pers抓住了这个机会Onal个人帐户。使用UND分享我们自己的想法。它是由我写的,所以我不会用各种高音词来欺骗所有人,但是我想谈谈一些现实,对机器人行业的长期视野以及Dyna的角色的地位。本文是第一篇文章,主要是关于我们对科学研究局的一些想法。稍后,我将继续从其他角度写作。 Dyna是如何开始的?它可以追溯到公司去年第一次设定的时间。当时,中国类人形机器人部门已经很热了。外国人,例如数字,体力情报,合格的公司和机器人,也在国外释放,并且该收藏量开始了大型资金。我们选择加入该节点,但这实际上是一个晚点。甚至有投资者都无法命名我,我们在口头困惑中问自己:“您没有背景。为什么您要与老年人竞争这些行业的D老师实际上很长一段时间:如果您想建立公司,您可以在这家巨人的生态学上做什么道路?当时,Lyndon和Jason,Lyndon和Jason实际上尝试了许多方向,我实际上是一起尝试了许多方向,并最终走上了我们在整个决策中的范围。当时,当动作圈非常受欢迎时加固学习路线。ST模拟和合成数据环境。每条路线都有许多关注者问题。我们可以看到的实际上是一个非常早期的原型。即使在今天,也没有真正确定的方向是“绝对可着陆的”技术道路。自2016年以来,我一直在AI工作,我一直在从事一系列工作。从第一个传统的自动学习和数据挖掘到中期深度学习的快速发展,再到变形金刚和几代人,我们都体验了自动学习行业的大部分发展。根据技术形式,我一直认为可以长期实施的AI技术必须非常可扩展。实际上,很长一段时间以来,深度学习一直无法实现真实的真实应用。基本原因是,它总是严格受到实际成本的限制,例如收集和数据使用中的收集和标签。比较传统自动学习时TEC在深度学习之前,HNOLOGIES,特别是在建议,广告和其他领域中广泛使用的系统,其快速扩展的关键是数据收集相对容易,并且可以形成低成本的闭路。许多推荐的系统问题可能会通过自学意义开始感冒。只需分析用户的点击行为即可找到具有相似兴趣的用户,并建议内容Ifmilar。整个系统的数据源和反馈机制是封闭环路,可以不断以低成本攀升。但是,一旦我们进入了一个深度学习的时代,尤其是在计算机视觉领域,数据问题突然变得更加复杂。数据的积累和注释已成为中央瓶颈。与推荐的系统不同,视觉任务很难通过自我监控获得有效的培训信号,并且经常信任手动获取和精细的标签。这使得数据迭代非常异性特定于任务。大型公共数据集(例如ImageNet和Coconor One)手工。这就是为什么深度学习在行业中的大规模应用如此慢的原因。最典型的例子是无人传导,积累有效数据花了十多年。面部识别,工业检测,产品识别和其他领域面临类似的问题,最终在高度个性化的通用建模系统中发展。这部分解释了为什么其他公司现在面临巨大挑战,除了当年的“四个小龙”以及“ AI的四个小龙”在资本市场中取得了相对良好的结果。深度学习的中心主题不能直接信任一些常见的数据集,例如推荐的系统。图像任务的复杂性比推荐系统的复杂性要大得多,并且一般数据集很难接受稳定的广义性能e。为了获得稳定的实施结果,我们必须依靠更高质量的数据和更多方案。这意味着更高的人工成本,因此无法完成这条道路。让我们谈谈为什么这次巨大的模型浪潮已经耗尽了。许多人说,Openai押注了“运动中的奇迹”的正确策略,但是我认为真正的核心是语言数据具有自然优势:清晰,大规模的结构,易于恢复,几乎不需要手动注释。当今的大规模语言模型主要基于网络实现之前的文本,语言数据格式基本上是由用于代表世界的人类设计的结构化系统。与图像和音频相比,语言具有更大程度的结构和较小的数据噪声,这使其成为数据源“干净的本地”。此外,语言模型中的培训的方式基本上是自我控制的。必须解决模型量表上的培训成本问题简单地通过预测以下令牌而没有手动注释。这完全是由于如此可行且低成本的训练途径,在该路线中,通过手动检测和人类环的精细调整方法构建了SFT数据。最后,我们已经完成了诸如Chatgpt之类的产品背后的完整培训电路。然后,总而言之,如果AI系统具有长期和大规模应用的潜力,则必须同时满足两个先前的要求。 1。数据收集成本足够低。尽管缺少这两个条件,但该AI系统的长期实施的可能性非常有限。如果您想考虑LTHE机器人领域中的数据,请参见Dynavolo的开始,实际上与当前语言模型(甚至当前的多模式VLM)大不相同。从以上两个因素来看,首先,机器人数据本身很少。与文本数据不同,机器人数据大小当前只能是SMA文本或视频数据的分数。机器人数据采集需要物理机器人干预。还使用UMI作为可扩展方法来实现数据收集。这些书仍然非常昂贵。通过人类视频数据学习在技术上是可行的,但是存在固有的实现差距。从先前对“高质量数据”的定义来看,这意味着这种类型的数据本身还不够高,并且极其难以有效使用。同时,就机器人而言,“高质量数据”不仅意味着它们是由本体论机器人编译的,并且实施中没有差距,而且还意味着这些数据应反映完成任务时机器人的效率,稳定性和可靠性。当前语言模型的最大问题是幻觉,但是如果机器人发生同样的问题,结果是灾难性的,可能会直接影响安全性。因此,我们认为ReliabLE技术路线是:1。有必要收集少量的高质量,多任务处理,广义数据,并首先建立对物理世界的基本理解。 2.使用强化学习在几种实际情况下提高执行的可靠性,从而使机器人具有改进的能力(解决高质量数据的问题不足)。 3。使用这些高质量数据返回基本模型,逐渐交换低质量的初始数据,不断提高其一般功能。 4。继续收集更多任务,然后返回步骤1以形成可持续的迭代。在此过程中,DYNA不受单一技术形式的影响。他们使用Aloha和Umi,在模拟环境和合成数据以及世界模型和人类视频中都有经验。我将尝试这套迭代逻辑,以便我可以提前。目前,在Chatgpt成功之后,该行业的许多路线都“侵入性”。我们继续使用我们的“权力”方法。无论您是建造自动数据收集工厂还是分包第三方设备,目的都是收集用于大规模任务的操作数据。但是,我认为问题是:数据质量没有明确的标准。当前,实验室通常使用“成功的速率”作为模型功能的度量。随着时间的流逝,这表明已将数据逆转到数据收集标准。每当任务完成时,数据就会“有效”。但是,在机器人时代,这种标准还不够,我们认为即使是ImageNet或GPT使用的互联网数据质量也无法实现。这也是我们选择尽快输入真实场景并收集数据的原因。高质量和低成本摘要是机器人数据长期积累的基石。 “高质量”本身只能通过真实的环境和实际需求来衡量。因此,此封闭的所有链接链接至关重要。返回原始问题,您为什么要演示这种“莫名其妙的” Dyna-1?实际上,如果机器人模型本身没有您的模型,那么我们看到上面关闭的第二个循环链接。我的提高能力是完全信任编译和驾驶的能力,因此几乎不可能同时实现高质量和低成本。我可以使用仿真和合成数据吗?当然,我们不会否认其价值。 Dyna-1仅表示我认为目前最可行的路线,并不意味着其他道路并非无效。但是,我们认为,基于当前的Avant -Garde结果,在精细行为领域中仍然存在一个伟大的SIM的差距,并且合成数据仍处于早期阶段,并且需要时间来验证。相反,我们选择从这个步骤开始,因为在现实世界中的增加是通过此闭合电路运行的最快,最可能的方法。 dyna-1:1。强调24小时的可靠性,我们已经表明,加强学习方法可以帮助机器人独立,连续学习,改进,从而提高数据的质量。我认为这是针对机器人的,如果您没有能力的话,强化学习过程将非常痛苦。可以每隔几分钟进行一次手动干预,并且可能不会调查有效的战略空间。 2。强调数据的质量和任务终止速度。除了观察通常完成的任务外,我们还将使用最终产品的实际客户标准来确定数据的质量。这是前闭合电路的组成部分。想象一下,如果事先没有标准,数据质量要求只是“尽可能多,尽可能少,可能会有很少的错误创建”的模糊目标。这种类型的“测试”反馈几乎没有培训值。只有一位网球教练说:“尝试扮演Accu尽可能地“”,这些评论将无助于提高其动作的卡利达。3。还可以观察到一般化能力的改善。我们感到惊讶的是,高质量的数据支持会导致该模型零的泛化功能的重要飞跃。学习优化的数据导致零镜头的成功率提高。F“堆叠的餐巾”可以商业实施。另一方面,在科学研究的层面上,已经证明了具有长期可持续性的商业科学数据和数据传单的循环。如果您不能做这个闭合电路,那真是可惜。从最后的经验来看,它最终可能是您无法庆祝的项目之一。从成立Dyna的那一天起,我们就认为它是一家通用公司,可扩展,并且能够在人类Agi职业中真正发展。好的,这本文章是第一篇文章,它主要是关于科学研究的吗?这解释了Dyna-1的值。我将继续从各种角度分享一些文章。我希望每个人都期待和外观。

Copyright © 2024-2026 澳门PG电子游戏_电玩城游戏大厅 版权所有

网站地图

沪ICP备32623652号-1