今日头条整改首先扩招审核团队,靠机器学习推荐内容已是伪命题?

“今日头条将强化总编辑责任制,全面纠正算法和机器审核的缺陷,不断强化人工运营和审核,将现有6000人的运营审核队伍,扩大到10000人。”4月11日早4时33分,今日头条创始人&CEO张一鸣在其《致歉和反思》信中说。

作为国内最大的智能内容平台,今日头条一直以机器学习推荐技术引以为傲。此次大幅度扩充运营审核团队,或许是认为,以机器学习为主导的机制,已无法负荷庞大的内容审核工作,需要加大人工辅助力度了。

今日头条整改首先扩招审核团队,靠机器学习推荐内容已是伪命题?

指控、处罚、责令关闭内涵段子,今日头条整改行动从本月正式开始

早从今年3月开始,用户可能或多或少的有所感觉,甚至提出疑问:包含低俗、违法、虚假等内容的今日头条,是不是快要不行了?

3月8日,央视财经发布《“今日头条”终于上了“头条”!无视监管,竟做起这种“黑勾当”!害苦2.4亿用户...》文章,直指“今日头条”利用“二跳”手段发布虚假广告,严重侵害消费者合法权益,并危害到相关药品企业正常经营;

3月29日央视《经济半小时》栏目直接指出,今日头条枉顾监管约谈,明着合法,暗中“二跳”广告的“黑勾当”;

3月30日,就广告违规问题,北京工商行政管理局海淀分局对今日头条行政作出处罚,没收广告费并处以广告费用3倍罚款,总计达94.4万元人民币;

4月4日,国家广播电视总局对今日头条、快手两家网站的主要负责人进行了约谈,要求全面整改;

4月9日,多家应用商店下架今日头条APP,暂停其下载服务3周,时间从4月9日15时起至4月30日15时止;

4月10日,国家广播电视总局责令今日头条永久关停“内涵段子”。当晚,今日头条关停“内涵段子”。

近一个月的时间,央视及国家相关监管部门接连不断的的指责,几乎在大众面前将今日头条批的体无完肤。为此,今日头条方面承诺,将把4月作为整改月,全面清查产品中存在的问题,并定期向监管部门汇报整改进度,向公众同步整改结果。

依靠机器学习推荐机制,今日头条仅用6年便成为国内最大的智能内容平台

从2012年发布第一个版本至今,今日头条仅用不到6年的时间,便发展成为了国内最大的智能内容平台。相关数据统计,截至2017年7月31日,今日头条的日活跃用户数已经达到了1.2亿,较2016年同期翻了一倍多。

今日头条整改首先扩招审核团队,靠机器学习推荐内容已是伪命题?

众所周知,机器学习推荐机制是今日头条最大功臣。纵观今日头条推荐的结果看,其智能算法大致走了以下几大流程:

一、数据抓取,从用户在该平台的浏览动态或其他账号日常动态中抓取相关数据。

二、用户分析,每个用户都是一个数据库,信息浏览行为越多,其数据库中的数据也越多。智能算法会对这些数据进行整合与分析,从而提炼出该数据库的关键词。

三、内容审核,智能算法主要做了两件事,消重和审核。

消重,就是辨别内容相似度,以避免推荐给用户的内容过于重复。显然,这一点,今日头条做的并不好,用户经常会看到相似内容,甚至标题、图片等都很相似;

审核方面,这是今日头条被严厉指责的关键问题所在。因算法尚未成熟,人工干预度低,导致很多未经人工审核的将色情、低俗、虚假、违法等内容通过了审核。

四、新闻推荐,这是与用户直接关联的一步。从今日头条的推荐机制看,内容会被推荐与否,与热点、点击量直接挂钩。这是智能算法对内容受欢迎程度的一次判断。

但显然,今日头条这一内容平台,并没有很好的做到其所期望的。

虽加大人工审核力度,机器学习推荐内容依旧是大势所趋

“3月29日央视报道我们的广告问题后,我不断反思自己以前的想法,反思公司现在的做法,开始大力推进公司员工提高意识、改进管理、完善流程。”这是张一鸣的反思之一。

而随后的行动,就是“强化人工运营和审核,将现有6000人的运营审核队伍,扩大到10000人。”

显然,今日头条这个人工智能内容平台,已经认识到机器学习的不足,开始更为重视人工了。对此,有网友提出质疑,从人工到人工智能是进步,从机器回到人工,这是历史和科技的倒退?

今日头条整改首先扩招审核团队,靠机器学习推荐内容已是伪命题?

去年11月,张一鸣在2017今日头条创作者大会上透露,其头条号账号总数超120万,平均每天发布50万条内容,创造内容消费达48亿次。

以每个账号每天投稿5条内容算,头条好每天的投稿内容达600万条。除此之外,今日头条旗下还有悟空问答、微头条、西瓜/火山/抖音以及已经关停的内涵段子。该平台每天的投稿、上传内容超4000万。

仅靠1万的人工,显然是无法完全负荷审核任务的。仅从目前来说,今日头条的审核推荐机制,依旧以机器学习算法为主导,并加以大量人工辅助。

其实,除了今日头条,新浪微博、微信公众号、快手短视频、界面等平台也有相关的机器学习审核算法的加持。如新浪微博,其会实时更新关键词,如果用户发布的内容涉及到相关关键词,就会被屏蔽或删除。

而微信公众号作为现今流量排前的内容平台,其在内容审核方面则较为严谨。有过运营经历的人应该经常碰到,一旦提交审核的内容中提及了一些敏感内容或词汇,其审核时间就会非常得长。

很显然,在平台多元、领域多样、数量越来越庞大的情况下,通过机器学习审核推荐内容是大势所趋。仅靠人工,非得累死。

不过,当前的机器学习算法能工作质量,还远不及人类,否则,今日头条也就不会陷入如此窘境了。就像扎克伯格曾经说的一样,Facebook对人工智能非常依赖,希望能够通过AI改善审核机制。但想要完全依靠AI审核内容,可能还需要5-10年的时间。

机器学习算法作为每一次内容低劣指控的“背锅侠”,需要的,可能只是时间和耐心。在没有完全成熟之前,可以是主导,但绝不可以是唯一。技术提升加以人工辅助,是对用户最大的负责。

“我是工程师出身,创业的初心是希望做一款产品,方便全世界用户互动和交流。因此,在过去几年间,今日头条将更多的精力和资源,放在了企业的增长上。现在,我们必须重新梳理我们的愿景,保证所‘创作’与‘交流’的内容是积极向上的、健康有益的,能够给时代、给人民带来正能量。”张一鸣说的似乎很诚恳。

最后

快手的创始人&CEO宿华曾表示,技术让每个人前所未有的得到了表达自我的机会,但也带了新的社会问题。因为几千年来,人们所适应的,是由人呈现出来的世界。我们需要去适应新的世界。

当然,这里不得不提一句,机器学习算法是在抓取用户“行为数据库关键词”之后才进行的推荐。如果,你能抵制住低俗内容的诱惑,又怎会被这些内容推荐“干扰”?

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

赞助商
2018-04-12
今日头条整改首先扩招审核团队,靠机器学习推荐内容已是伪命题?
“今日头条将强化总编辑责任制,全面纠正算法和机器审核的缺陷,不断强化人工运营和审核,将现有6000人的运营审核队伍,扩大到10000人。

长按扫码 阅读全文