随着TikTok在美国经历禁令风波,众多海外用户涌入小红书,随之而来的语言障碍成为最大挑战。然而,小红书迅速上线的翻译功能,不仅仅解决了用户之间的沟通问题,更展示了其强大的AI实力,竟然可以翻译网络俚语、颜文字和摩斯密码。该功能背后究竟蕴藏着怎样的技术秘密?小红书的AI布局又将如何形塑其未来发展?
在2025年1月18日,美国政府对TikTok发出禁令,导致该应用于当地时间中午停止服务,并于1月19日中午恢复。这在短短几天内便让大量用户转向寻找替代品,试图在小红书中寻找新的社交平台。然而,小红书在这场用户迁移潮中,并未专注于海外扩张,反而面临海内外用户共同使用服务器的挑战,因此快速行动以应对。
1月16日,TikTok停服的消息在美国迅速传播,接下来,用户尤其是年轻一代开始大量涌入小红书。新用户与原有社区的语言隔阂致使沟通不畅,成为迫切需要解决的问题。在大量用户的呼声下,小红书于1月19日上线翻译功能。起初,众人预期该功能只是一个基础的语言翻译,能够实现中文与设定语言的互译。很多用户最初认为小红书只是简单地接入了翻译接口,认为它将成为翻译行业中的一个“旁观者”。
不过,随着使用者的增多,用户们却发现,这一翻译功能远比他们想象中复杂,一些网络流行语和特殊字符也能被准确翻译。例如,网络俚语、颜文字甚至摩斯密码都能准确“转换”。这种现象让人不得不思考,究竟是什么技术在背后发挥着作用。
深入探讨后,很多用户发现输入特定格式内容时,似乎在向系统发出“指令”。最终甚至几位技术大佬浮出水面,大家一致推测,小红书已经接入了大语言模型(如GPT-4)。这一发现使人们明白,为什么众多新潮内容能被以一种符合用户习惯的方式翻译出来。
我个人推测,小红书在使用大语言模型时,提前设定了“翻译用户输入”的提示,将评论内容作为输入,但由于模型的不稳定性,这一过程并未如预期般完美。有用户在评论区测试后,提到系统有时甚至会自称是“智谱清言(ChatGLM)”。在经过多番测试后,用户们仅仅见证了两个结果:【GPT-4】与【智谱清言】。
从技术层面上看,这种现象背后有多重原因: 1)出于政治原因,主流社交软件若接入国外API,可能会涉及信息安全问题。 2)性能方面,GPT-4在中文语料上的训练相对较少,难以达到小红书目前展现出的翻译能力。 3)权限问题,GPT-4的开发公司OpenAI去年7月切断了对非支持国家的API服务,而其中不包括中国内地及香港、澳门。
因此,接入的模型或许是智谱清言,本质上是对GPT模型的微调,让其在翻译时借用了GPT的语料库,从而在某种层面上产生了“幻觉”。
回归产品功能分析,从产品定位的角度看,小红书的翻译功能并不局限于一般翻译工具的定位。想想互联网交流,俚语作为沟通的重要组成部分,呈现出此类应用的必要性。在TikTok难民潮中,很多美国用户开始热衷使用如“NB”、“666”、“cpdd”等富有中国特色的网络俚语,以此融入社区。
大语言模型的接入,让产品的定位达到了新的高度:一方面顺应了翻译功能的需求,另一方面也在文化融合上取得了成功。对于美国用户而言,使用小红书的门槛因此降低,平台在不同社交需求中找到了满足点。对于小红书的“原住民”用户,也因这次独特的体验感到好奇与自豪,同时强化了AI为应用带来的提升。这一切都使得小红书在TikTok暂停服务的短时间内,成功吸纳了大量流量,并在AI应用探索上迈出了重要一步。