标题:AI新突破:卡内基梅隆推出乐高式GPT积木,颠覆创作想象力
随着科技的飞速发展,人工智能(AI)正在逐步改变我们的生活。近日,卡内基梅隆大学的研究团队开发出了一款名为LegoGPT的AI模型,该模型能够根据文字指令生成可实际搭建的乐高设计,无疑在积木搭建领域掀起了一场技术革命。
首先,让我们来了解一下LegoGPT的基本原理。该模型是一种自回归大型语言模型,通过预测下一个token的方式,判断下一块该放置什么积木。为了提高模型的准确性,团队还为模型增加了有效性校验和带有物理感知的回滚机制,确保生成的设计不会出现积木重叠或悬空等问题,也就是说最终结果始终可行且结构稳固。这种设计理念,使得LegoGPT不仅能够输出美观的设计,还能够保证其实用性和稳定性。
值得一提的是,LegoGPT输出的设计不仅支持人手搭建,还支持机器人操作。这一特性使得乐高搭建不再局限于人力,机器人也能参与到乐高搭建中来,这无疑为乐高搭建领域打开了新的可能性。
为了训练LegoGPT,团队创建了一个名为StableText2Lego的数据集。该数据集包含超过47000个乐高建构样本,涵盖了28000多种三维造型,包括书架、桌子、椅子、汽车、船只、吉他等。这些数据被用来训练模型,使LegoGPT能够从一段文字生成独特且原创的设计。
训练过程并不是一蹴而就的,团队采用了复杂的构建流程:系统会先将文本提示转化为ShapeNetCore网格模型,再将其嵌入一个20×20×20的体素网格中,从而生成初步的乐高积木布局。随后,系统会对这些布局做出变化,并剔除结构不稳定的设计。保留下来的样本会从24个不同角度进行渲染,最终交由GPT-4o生成相应的描述文本。
LegoGPT的出现,无疑为积木搭建领域带来了巨大的创新。首先,该模型能够根据文字指令生成独特的乐高设计,极大地丰富了积木搭建的创意空间。其次,该模型具有强大的自回归能力和物理感知回滚机制,能够保证生成设计的稳定性和可行性。最后,LegoGPT的开源特性使得其他人可以复刻或扩展该模型,进一步推动该领域的发展。
总的来说,LegoGPT的出现是一个巨大的突破,它不仅颠覆了我们对积木搭建的想象力,更在积木搭建领域开启了一场技术革命。我们期待看到更多基于LegoGPT的创新应用和可能性在未来的涌现。同时,我们也期待AI技术能够在更多领域发挥其巨大潜力,为我们的生活带来更多的便利和乐趣。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )