随着人工智能(AI)的进步,经过训练能够理解和生成人类语言的“大规模语言模型(LLM)”的出现,正推动着自然语言处理(NLP)技术的飞速发展。得益于LLM的进步,生成式人工智能(如ChatGPT)也能够理解上下文并进行更自然的对话。LLM已被广泛应用于数据处理行业,并在支持人工智能技术的快速发展中发挥着关键作用。
近年来,语言模型(LLM)不断发展,演变为针对特定领域(例如通信、游戏、安全和法律)的复杂、专业化形式。通用语言模型虽然基于海量数据进行训练,但在需要深度专业知识的领域仍存在局限性。此外,它们还面临着信息安全漏洞和预测错误等固有问题。因此,企业正在构建更加精准的专有语言模型,通过训练反映各行业独特特征的专业知识和数据来实现这一目标。让我们来看一些企业如何通过针对自身行业和业务优化的“领域特定语言模型”来推进人工智能技术发展的案例。

Crowdworks凭借在各个行业开发企业级人工智能的丰富经验,最大限度地减少了幻觉问题。
人工智能技术公司 Crowdworks 提供“数据引擎”,用于预处理人工智能学习所需的数据;同时还提供“人工智能解决方案”,为每家公司量身定制大规模语言模型 ( LLM ) 构建服务。Crowdworks 通过其数据引擎运营着一个数据标注平台,该平台可将图像和视频等各种数据转换为人工智能可识别的格式。该平台允许个人参与标注任务并分享收益,并将生成的数据出售给金融机构和搜索引擎等客户。Crowdworks 拥有 62 万名注册标注员,是韩国注册标注员数量最多的公司。
在人工智能解决方案方面,微调解决方案LLM平台于2023年9月上线。它被选为Naver HyperClova X的官方合作伙伴,并在今年上半年推出了面向企业的SLM平台“ WorksOne ”。此外,它还运营着“Crowd Academy”,该平台负责培训构建人工智能数据所需的人才。Crowd Academy是一家为标注员提供培训内容的企业,曾入选2021年的“国家未来学习卡”课程和2023年的“平台工作者专业培训”项目。
具体来说,Crowdworks 凭借其在各个行业开发企业人工智能的经验,最大限度地减少了 LLM 的慢性幻觉问题,并通过结果数据和性能验证来提高答案的完整性和准确性,从而提高了客户满意度。
◆ S2W展示了其采用暗网专用语言模型的专业数据处理能力。
专注于人工智能和安全领域的数据智能公司S2W(以下简称S2W)因开发出全球首个专为暗网设计的AI语言模型“DarkBERT”而备受瞩目。该模型能够分析暗网上的复杂语言和非法内容。暗网被认为是毒品分销、勒索软件攻击和黑客攻击等各类网络犯罪的温床。DarkBERT模型基于从暗网收集的约3亿页文本数据进行训练,在暗网页面主题分类和勒索软件泄露站点检测等分析任务中表现出色,从而显著提升了网络犯罪调查的效率。此外,S2W还将其基于DarkBERT开发的暗网专属聊天机器人“DarkCHAT”集成到其人工智能大数据分析平台“XARVIS GLOBAL”中。该平台已提供给印尼政府机构,使用户能够即时查询所需的网络犯罪相关信息。
继 Darkbert 之后,该公司新发布的网络安全专用人工智能语言模型 CyberTuned 旨在高效学习非结构化网络安全数据,尤其是 URL 和 SHA 哈希值等非语言元素,从而在网络威胁情报 (CTI) 任务中展现出差异化能力。此外,该公司正将其通过开发网络安全专用语言模型积累的自然语言处理 (NLP) 技术诀窍和专业数据处理能力扩展到包括制造业、分销业、金融业和公共部门在内的多个行业。
◆ BHSN开发了自己的专业 LLM 课程,以提高从法律咨询到合同审查的效率。
还有一些人工智能平台通过专注于法律市场的LLM(法律硕士)来最大限度地提高法律效率。由法律人工智能解决方案公司BHSN开发的Allibee就是一个专门针对法律领域的、基于生成式人工智能的软件即服务(SaaS)平台。它通过理解上下文、掌握词义并提供相应的响应,为法律合同相关任务提供优化的功能。
Allybee 基于 BHSN 自主研发的法律 AI 语言模型“BHSN Legal-LLM”构建而成。该模型基于大量高质量法律数据进行密集训练,这些数据包括合同、法规、判例和政策,由律师和 AI 工程师合作筛选和生成。基于这些高度精准的信息,Allybee 实现了专为法律领域量身定制的详细功能。它还提供诸如修改合同以使其符合内部政策等服务,并利用来自包括企业、公共机构和律师事务所在内的各类客户的数据。目前,Allybee 正被用作一体化 AI 商业解决方案,基于这些专业的法律领域功能来提升工作效率。
SKT通过“Telco LLM”(一种为电信公司定制的语言模型)革新内部业务。
SK Telecom(以下简称SKT)的“Telco LLM”是一款专为电信行业打造的LLM,它深入研究了韩国国内电信术语,例如5G资费套餐、T会员制、公共补贴等,并遵循内部AI伦理准则。SKT收集并筛选了大量韩国电信数据,并利用其自主研发的“AX”、OpenAI的“GPT”和Antropic的“Claude”等多引擎模型进行训练,构建了这款基于多引擎的LLM。该LLM经过专门针对电信企业的精细调优,旨在处理电信服务、会员权益、客户咨询模式等专业电信领域的数据,使其能够执行比通用LLM更高级的任务。
SKT正通过其多引擎电信LLM,针对每项业务选择并应用优化的LLM,从而提升内部运营效率。该LLM能够适应各种电信工作场景,并实现相应的功能。近期,SKT推出了“AI咨询支持系统”,这是国内大型客户服务中心中首个基于LLM的系统。该系统允许咨询人员通过自然语言输入问题,快速搜索和整理所需信息。此外,SKT还构建了“AI文档自动处理系统”,该系统利用能够理解文本和各种图像的大型多模态模型(LMM),自动处理客户通过短信和电子邮件发送的文档。SKT计划将电信LLM的应用范围扩展到分销网络管理和网络基础设施运营以外的各种业务场景。
NCsoft 的“Barco LLM”为游戏和娱乐领域之外的创意人工智能提出了新的范式。
VARCO LLM 是 NCSOFT 自主研发的首个 AI 语言模型,通过支持游戏开发领域高质量内容的创作,引领游戏和娱乐行业的创新。VARCO 专注于学习游戏内内容(例如文本和场景)的开发数据,在生动策划、运营和美术等内容开发的各个环节都展现出卓越的效率。特别是基于 VARCO LLM 的 VARCO Studio,是一个专注于游戏制作的 AI 平台服务。它通过 VARCO Art(一款基于 Web 的图像创作工具,专用于 NCSOFT 的知识产权)、VARCO Text(一款文本创作和管理工具)以及 VARCO Avatar(用于创建 AI NPC 和聊天机器人)等主要 AI 功能,支持整个游戏开发流程,助力打造高质量内容。
尽管Varco LLM是一款专为游戏内容创作而设计的语言模型,但通过签署开发特定领域模型的商业协议,它已被应用于汽车平台、教育等多个行业。NCsoft期望Varco能够提供有别于现有通用创意AI的创新能力,并持续开发和发布性能更优的优化语言模型,例如新一代的“Varco LLM 2.0”和“Llama-VARCO LLM”。未来,NCsoft计划将开发Varco的AI研发机构“NC Research”分拆为子公司,成立一家专注于AI技术研发的子公司,并推进相关技术的发展。
- 查看更多相关文章
You must be logged in to post a comment.