为依法保障用户对抖音算法及模型服务的基本原理、目的意图和主要运行机制等的知情权,告知用户抖音提供的算法及模型服务的备案情况,我们制定本《“抖音”算法及模型备案公示说明》,帮助用户了解在使用抖音产品和服务的过程中我们如何通过算法及模型技术向用户提供信息和服务,充分保障用户的合法权益。

一、算法

1. 个性化推荐类

1.1 算法名称:抖音个性化推荐算法

1.1.1 算法基本原理

抖音个性化推荐算法基于系统收集的用户设备信息、位置信息以及在使用产品时的行为信息(行为信息包括用户在访问/使用产品时的点击、关注、收藏、搜索、查询、浏览、下载、分享及交易的操作相关记录),通过对上述信息进行自动分析和计算,根据计算结果从信息候选池中筛选出用户可能更感兴趣的内容进行推送。

抖音个性化推荐算法会根据用户在使用产品过程中的浏览行为对推荐模型进行实时反馈,不断调整优化推荐结果,更好地向用户提供优质内容。

1.1.2 算法运行机制

抖音个性化推送算法主要是基于用户历史的点击、时长、点赞、评论、分享、转发、不喜欢等行为数据,通过深度学习技术框架建立模型,预估用户对某个内容产生互动的概率,针对预估内容使用排序、打散、干预等机制和策略后,再向用户进行推荐。

用户行为参考<用户,内容,互动>三个维度作为样本进入机器学习模型里训练,训练的结果用于更新用户模型和推荐新的内容。

为了避免“信息茧房”问题的出现,抖音个性化推荐算法专门设计了“兴趣探索”机制。一方面每次推荐都会选择用户过去不常观看的内容类目进行一定比例的推荐。另一方面每次获取推荐内容的过程中会特别增加一条随机内容来保障用户可见内容的多样性。

1.1.3 算法应用场景

抖音个性化推荐算法在抖音主要用于图文或视频、商品及服务(广告)等内容的推荐。

1.1.4 算法目的意图

帮助用户提高获取优质信息的效率。

1.1.5 备案编号

网信算备110108823483902220017号

1.2 算法名称:头条搜索算法

1.2.1 算法基本原理

头条搜索算法主要利用自然语言处理、点击模型和大规模的图模型等深度学习技术来不断提高搜索结果的准确性、时效性、权威性,缩短用户的搜索时间,提高搜索效率和质量。

1.2.2 算法运行机制

头条搜索算法主要通过对用户查询内容的意图分析,从海量的内容(包括但不限于网页、视频、图片等所有可被检索的对象)中找到和用户需求相关程度最高的搜索结果,综合考量内容相关性、时效性、权威性等因素后返回给用户。

1.2.3 算法应用场景

头条搜索算法主要应用于抖音短视频搜索功能。

1.2.4 算法目的意图

主要旨在提高用户主动获取信息的效率,优化并提升用户对图文或视频、商品及服务(广告)等搜索结果的满意度。

1.2.5 备案编号

网信算备110108823483904220019号

1.3 算法名称:头条热榜算法

1.3.1 算法基本原理

头条热榜算法主要是基于自然语言处理、深度学习和统计技术,结合用户在产品内真实的互动情况,聚合并计算同类信息的实时热度数值,并按照该值进行排序、展示。

1.3.2 算法运行机制

头条热榜算法主要是根据用户在各产品内真实的浏览、点击、搜索等互动数据,聚合并计算同类信息(如同一事件、同一话题项下的内容)的整体热度数值,并根据社区规范进行筛选,将事件、话题或内容根据实时热度值从高到低排序,并将榜单展示给用户。

1.3.3 算法应用场景

头条热榜算法目前在抖音端内服务于抖音热榜功能。

1.3.4 算法目的意图

主要目的是为了帮助用户快速获取权威、全面、新鲜的热点资讯,避免出现信息茧房。

1.3.5 备案编号

网信算备110108823483903230017号

2. 生成合成类

2.1 算法名称:剪映特效算法

2.1.1 算法基本原理

剪映特效算法主要是基于图片视频的编解码、内容理解、视频剪辑、端上渲染等技术输出符合用户需求的结果,并在部分特效中加入智能化的图像处理与深度学习技术,以降低用户操作门槛并提升整体输出质量。

2.1.2 算法运行机制

剪映特效算法主要是通过接收用户的图片视频或摄像头输入,对图片或视频进行渲染处理与格式转换,然后输出符合用户需求的结果。部分算法还会在渲染处理前增加深度学习模型处理环节,以提升整体输出效果。上述模型通过离线训练与加密处理后得到。

2.1.3 算法应用场景

剪映特效算法在抖音主要用于发布功能。

2.1.4 算法目的意图

剪映特效算法主要目的在于提供简单、易用的视频剪辑能力和视频模板,帮助用户轻松记录生活。

2.1.5 备案编号

网信算备110108823483901230015号

2.2 算法名称:豆包大模型算法

2.2.1 算法基本原理

豆包大模型算法是一种基于Transformer架构的语言模型,通过前文预测下一个最可能的词语来实现文本生成。其中运用的新技术主要是基于Transformer架构的语言模型和基于人类反馈的强化学习,前者建模了大量蕴含在自然语言中的知识,后者使得模型可以通过对话方式提供合适的内容。

2.2.2 算法运行机制

豆包大模型算法在用户提出问题后,识别用户的需求,通过预先学习与全网搜索内容,在对话框中或落地页中展示对应的结果。该模型首先通过大规模无监督的预训练学习语言的统计规律和知识,然后进行有监督的微调让模型学会遵循用户的指令,最后通过强化学习训练让模型生成合适的内容。

2.2.3 算法应用场景

豆包大模型算法主要应用于抖音网站或应用程序内的AI搜索等相关场景,以及抖音内接入的豆包服务。

2.2.4 算法目的意图

豆包大模型算法旨在提升用户获取信息效率,扩展知识边界,通过提供优质问答交互等服务,帮助用户深入了解世界。

2.2.5 备案编号

网信算备110108823483901230031号

二、大模型

1. 模型名称:豆包大模型

1.1 模型备案编号

Beijing-YunQue-20230821

1.2 模型应用场景

豆包大模型主要应用于抖音网站或应用程序内的AI搜索等相关场景,以及抖音内接入的豆包服务。

2. 模型名称:豆包文生图模型

2.1 模型备案编号

Beijing-FuLuGua-20231205

2.2 模型应用场景

豆包文生图模型主要应用于抖音应用程序内的AI文生图功能。