虎博大模型发布即开源 同步发布三种API欲建行业生态

历经3个月“隐蔽模式”研发,国内新锐算法公司虎博科技于6月6日发布并开源其自研大模型TigerBot,同步发布大模型应用开发所需的全套API并提供多领域专业数据,旨在构建大模型生态蓝图。据悉,Tigerobot在经典公开NLP语料测试中表现不俗,效果逼近OpenAI同等大小模型的96%,更在推理式问答等个别领域表现亮眼。

Tigerbot是虎博科技自研的多语言多任务大规模语言模型,致力于改善人们的工作流以提高效率,将成为人们工作必备的外脑搜索引擎之一。参与评测的TigerBot-7B是其第一版MVP,经历了3000次实验迭代。目前,虎博科技创始人兼CEO陈烨持续带领团队改进,已迭代出同等大小且表现优于OpenAI的新模型,并将在近期更新发布。(产品体验:https://www.tigerbot.com/chat,登录即可申请体验,感受逼近OpenAI表现的国产大模型。)

根据OpenAI InstructGPT 论文在公开 NLP 数据集上的自动评测,TigerBot-7B 已达到 OpenAI 同样大小模型的综合表现的 96%,这得益于虎博科技在 GPT和BLOOM 基础上,对模型架构和算法进行了多项创新优化,包括指令完成监督微调的创新算法,以提升可学习型;运用ensemble 和 probabilistic modeling 的方法,实现更可控的事实性和创造性;在并⾏训练上,突破了 deep-speed 等主流框架中若⼲内存和通信问题,使得在千卡环境下可实现数⽉⽆间断等。此外,经对中⽂语⾔的更不规则的分布,虎博科技从 tokenizer 到训练算法等方面做了针对性算法优化,使得模型的问答更具中国文化属性。

(上图为公开 NLP 数据集上的自动评测,以OpenAI-instruct GPT-6B-SFT为基准,归一化并平均各模型的得分情况)

“此等一生难遇一次的大机遇,是吾辈之幸事!”在人工智能领域从业20年后,陈烨对大模型的横空出世发表了真挚的言辞,更激发了他内心年少时的激情。他认为,推进人类文明的技术变革往往源于本能、直觉和偶然性,而拥有自由的创新精神是根本。大模型技术就像是一门新兴学科,其未来的可能性将超过每个人的想象,他表示,现阶段过早和过于理性地探讨产品、应用、场景和商业化或许没有必要,更重要的是推广这一人工智能基础设施的原创突破,促进技术的发展和更新。“它将是颠覆式且长周期的。”

秉持科学创新无国界、无阶层的信念,虎博科技将以全套API形式开源Tigerbot的阶段性成果,试图与广大大模型应用开发者共同构建大模型生态蓝图,通过生态的发展反哺促进大模型能力迭代,让技术和产业发展共荣共生,共同打造中国的世界级应用。此次开源内容包含模型、代码、数据三部分,包含TigerBot-7B-sft、 TigerBot-7B-base、TigerBot-180B-research等多个模型版本,经基本训练且覆盖双卡推理 180B 模型的量化和推理代码,以及高达100G的预训练数据和监督微调 1G 或 100 万条数据。值得一提的是,TigerBot-7B-base的综合表现优于同等可比的OpenAI和BLOOM,TigerBot-180B-research 的参数量达1800亿,或是目前业内最大的大规模语言模型,而高达100G的预训练数据,更被视为目前业内最大且质量最优的开源预训练数据之一。同时,虎博科技还将开放大量的金融、法律、百科等领域专业数据,供应用开发者使用。

(开源地址:https://github.com/TigerResearch/TigerBot)

回顾Tigerbot研发过程,虎博科技致敬了硅谷90年代经典的“车库创业”模式,项目组在陈烨的带领下,从5人小队发展成目前10人小组。团队克服多重困难,在1月内实现自研全栈代码,当时测试表现已达OpenAI可比模型的80%效果,为整个团队注入了一剂“强心针”,促使他们不断突破事实性、创造性和思维链等底层研究,最终实现了算法、工程、数据的高效迭代。他们以每日至少3次,累计超过3000次的实验,打造出了Tigerbot。

据悉,虎博科技成立于2017年,以让人们获取知识更简单为愿景,致力于通过深度学习、自然语言处理等世界前沿技术,深入挖掘全球各行业信息,以可视化的问答方式呈现关键内容。同时,以贴近一线的视角精准洞察行业痛点,将核心技术产品化,帮助企业在日常运营、产品体验等多方面高度提效。截至目前,虎博科技融资额超越同阶段AI+NLP领域其他企业。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2023-06-08
虎博大模型发布即开源 同步发布三种API欲建行业生态
历经3个月“隐蔽模式”研发,国内新锐算法公司虎博科技于6月6日发布并开源其自研大模型TigerBot,同步发布大模型应用开发所需的全套API并提供多领域专业数据,旨在构建大模型生态蓝图。

长按扫码 阅读全文