← Back to Home

Case Study

AI Music Playground

为字节内部业务方提供的 AI+音乐体验工具

AI Music Playground — ByteMusic interface preview

项目背景

面临的挑战

作为字节内部的音乐中台,我们拥有海量的正版曲库,完善的音乐标签体系。与 AI 结合后会衍生出许多帮助业务使用音乐的场景。然而,内部各业务线(如短视频生态、商业化投流)仍受困于传统的找歌模式,不了解引入 AI 智能检索与识别技术后,能为他们的核心 KPI(如提升找歌效率、缩短剪辑耗时、拉升广告 ROI、规避侵权风险)带来多大的提升空间。

我们的解法

我们主导搭建了【AI Music Playground】。它不仅是一个技术展示大盘,更是一个‘业务翻译官’。我们将智能多模态配乐、自然语言检索引擎、以及高抗噪音频识别等核心能力,封装成高度贴合电商投流、剧情配乐、版权风控等真实场景的可视化体验。我们希望通过这种‘所见即所得’的交互沙盒,打破认知壁垒,让业务方直观感受到 AI 在海量曲库盘活与合规避险上的巨大效能,最终促成中台能力向各业务线的全面 API 接入与长期商业合作。”

商业目标

用极致的体验打消接入顾虑,建立中台技术与前台业务之间的信任感,最终推动我们的 AI 音乐能力向全公司的核心业务线进行规模化部署。

设计思路

通过三大步骤,从挖掘业务方真实的使用场景,并给予业务场景提供 AI 解法,以及帮助业务方之间建立与 AI 音乐技术之间的信任。让业务方能够感受到自己的真实需求有实际可落地的解决方案。最终达成音乐业务推广到全公司,接入指定业务方的的目标。

设计思路 — 四个步骤:挖掘场景、分析痛点、解法封装、建立信任

Step 1

构建业务使用场景

核心业务方

根据对于内部业务方的了解,与音乐业务有关联性的核心业务方主要分为以下四大类

核心业务方

业务方需求 - 需要哪些能力

前期通过了解发掘出对于音乐业务有潜在诉求四种不同内部业务方。并通过线上/线下调研分析得出他们会运用音乐的使用场景是哪些,以及所关联的能力是哪些

AI Music Playground — user research diagram mapping core functions, business goals, and feedback

能力转化为真实业务使用场景

为了能让业务方对于这些能力有更加具象化的理解。需要让他们在使用产品的过程中,更够直观感受到到这些能力适用于在哪些真实的用户使用场景。帮助他们更好去理解提供的 AI 能力 怎样赋能业务

能力转化为真实使用案例

构建业务使用场景

1. 展示(AI+音乐)能覆盖哪些场景?

在主页的 inspiration 模块。基于四个核心能力,围绕展示这四个核心能力展示与之相关的使用场景的实际案例,让业务方带着逛一逛的心态快速直观的了解这四个能力能覆盖哪些场景?能做哪些事情?怎么去给业务提鲜?

2. 定位业务方需要的指定场景

Ex: 在业务方点击视频配乐后,自动弹出视频素材库,并针对每一种真实使用场景进行分类,帮助业务方更快锚定想要使用场景。为后续的解决方案提供定好方向。

Step 2

基于场景提供解法

用户痛点 - 业务需求

大量在线上及线下收集了相关业务的用户他们在使用音乐场景时遇到的问题。并总结归纳为了四大核心问题。而这四大核心问题对应了业务方想要的四个能力:丰富的曲库/ 素材的高感知能力 / 智能化音乐检索能力 / 一键出片的高度工程化。因此,在设计方案时需要体现出 AI 是如何提供这四大能力的

用户痛点 - 解决方案

业务需求-设计策略

通过业务方所需要的能力,我们希望在提供基于使用场景的解决方案中去展现以下的策略

业务需求-设计策略

场景化智能解决方案

素材的情绪/场景高感知能力

在思考过程中,详细拆解 AI 如果分析素材的过程。从分析素材的内容,到如何匹配音乐节奏、频谱与音色、空间感与混响、到情感调性都详细的展示给业务方看。揭开 AI 黑箱,解决用户疑虑

素材的情绪/场景高感知能力

一键出片的高度工程化

将用户的素材与推荐音乐进行一体化封装展示。便于业务方快速浏览音乐与视频的契合程度。

一键出片的高度工程化

结果区的结构上,上方可以切换 AI 推荐的音乐风格,体现曲库庞大可以支撑多个风格的音乐推荐。中间区域展示匹配结果,音乐选择上会自动匹配与视频长度,情绪契合的音乐片段,做到一键出片的高度工程化。底部为音频的切换和控制区域。

一键出片的高度工程化
一键出片的高度工程化
一键出片的高度工程化

结果定制化调整

可根据用户的要求进行定制化调整,向业务方展示 AI 用户可根据用户的特别需求进行多轮推荐内容的调整

Step 3

建立需满足合作要求的信任

建立信任

数据可溯源

任何和数据相关的信息皆有真实信息来源可查看。保证提供的信息真实性。

数据可溯源

信息清晰透明

与歌曲相关的版权信息,数据指标、均可点击歌曲详情后在右侧面板查看

产品调性

我们的 AI Playground 秉持"极简操作,极致惊喜" (Minimum Friction, Maximum Wonder) 的设计哲学。我们摒弃了复杂的配置流程,转而采用直观的探索模式,让用户通过轻松的交互与故事驱动的探索,深度领略尖端 AI 技术的魅力。

产品框架

产品框架保持为左中右布局。右侧为导航区。中间区域为一级信息展示区,展示最为重要的内容对话流,底部的功能输入区可以切换功能,以及输入需求。最右侧为二级信息展示区,通常会展示对话流内信息的扩展内容。

产品框架

低门槛操作

通过极简路径与最少的主动操作,在我们的引导下,让用户快速上手并深度体验各项功能。

低门槛操作

用户点击 Music Copilot 后,会按照三个能力维度展示不同的快捷 prompts.

低门槛操作

用户点击智能配乐后,立即拉起素材库,供用户快速选择素材,尽量减少繁琐的主动上传文件链路。

The "Aha" Moment

我们希望所有的结果反馈都能够让他们感受到高效性、精准性与智能感。EX:上传素材后即可立即查看推荐的音乐与素材的匹配程度如何,并自动根据视频长度进行音频 clip 的选取

The "Aha" Moment

EX:用户想知道适合匹配悬疑短剧的背景音乐,AI 会根据多个方向进行歌曲的匹配,并给出推荐理由

EX:用户想知道目前印尼音乐最火的十首歌曲是哪些,AI 可快速生成一份 list, 并可查看相关数据。

结论展示

最终,该项目在内部体验好评不断。收获了和抖音音乐以及豆包业务部门的长期商业合作。以下是一些细分的关键指标。

关键指标