UP 主、视频创作、技术与虚拟主播

告别混迹 B 站的 2020 年

Posted by CY on 2021-01-17
Estimated Reading Time 24 Minutes
Words 7.3k In Total
Viewed Times

头图为两位日本 VTuber,分别为画师 神楽なな 的 VTuber 形象与其设计形象的 VTuber 百鬼あやめ

新年伊始的第一周,被疫情封锁在学校里的我终于重新拾起了搁置半年的视频更新。作为定番更新,依然是过去一年 Bilibili 虚拟主播区的数据统计。也正是因为上一年的统计视频意外受欢迎,才让我拿出了两三个月的时间做了一次全身心投入的“UP 主”。当然,一如往常,喜欢在生活经历和艺术作品中思来想去,让我不断有新的想法从看不见的地方冒出来。在经过了一年的“UP 主”生涯之后,或许现在正是把它们记下来的好时候。

UP 主是……?

不知道像我一样习惯作为观众的人,究竟是如何看待“UP 主”的?在上传第一个视频之前,这一直都让我觉得这是我不会完成的、困难的工作。视频制作是独立的技术,获得播放也似乎是难以企及的目标,积累粉丝和引人注目实在是难上加难。事实上,当周遭的各位听闻我开始做“UP 主”之后,总会或多或少地带着一点称赞的语气表示赞许,似乎达成了某些不太容易达成的事。光从这一点,就不同于在其他任何平台上发表内容——例如在新浪微博成为“博主”——所获得的反馈,着实令人觉得背后充满了魔力。

没错,名词常常是充满“魔力”的。它既形容一种事物,同时又规范人们对于一类事物的想象。名词的含义,会随着被它形容的人或物的形态而渐渐发生不为人知的变化,进而构筑人们对带有该名头的人或物的统一想象。举一个不太贴切的例子,从前的“床”既形容一种卧具,又形容一种坐具。随着作为坐具的“床”的消失,今天的人们已经不会对“床”这个名字产生太多除了卧具之外的其他联想。这是某种名词含义的缩减,反过来自然会有含义的不经意扩增。在我眼里,“UP 主”这个名词至少包括了两方面的含义:其一是对上传视频——一般特指在 B 站上传视频——的人们的统称;其二为前述的行为增添了某种“职业化”的色彩。

可以想见,这个来自于 NicoNico 「うp主」的名词,在作为动漫爱好者聚集区的 B 站建立最初并无今天人们直接想象中的职业化意涵。如它的名字所带有的某种非正式的味道,这些来到这里上传视频的人,也同样是因为各类兴趣而聚集起来的“非正式”视频爱好者们。但今天的情况显然已经不同了。随着一个又一个戴着“UP 主”头衔的人们得以将制作视频变为几乎可以远胜糊口的职业,随着边缘化的亚文化因为各类原因进入主流叙事,在 B 站做 UP 主真的成为了内容创作者们能够走通的经营方式。但视频制作天然的难度和复杂程度,让优质的视频总是分布在有限的账号中,辅以优秀账号获得的更多曝光资源,持续获得关注的总是我们都知道的相同的那些人。当我们提起“UP 主”的时候,首先想起的往往是这些粉丝数以十万计的人们(在行为学专业,这又被我们称为“可得性启发法”——人们总是会在直觉系统中率先想到那些有代表性的事物)。故而,“UP 主”变成了一种在直觉中光鲜的、年轻的、“月入百万”的视频制作者,完全不同于“视频上传者”这样的概念所指称的大众想象。而职业化的“UP 主”的另一面暗示,就是保持更新、保持高播放、保持粉丝增长等等……

如果在进入一个领域前,就把目标盯在最高处,那多半会让人在一开始就因为希望渺茫而放弃它。况且,为什么要给自己定一个目标呢?作为网站的运营者,通过名词的规训为“UP 主”们带来行为暗示或许是不错的战略;但作为并无打算把它当作职业的“UP 主”,第一件事就是破除它附带的魔力。数据的确会让人陷入期盼增长的无尽螺旋,有了 10 万播放就期待下次的 20 万,有了 60 万就去期待 100 万,即使知道旧的数字很难超越,也期望再有一次差不多的成绩……但对每个新人来说,视频播放都是“尽人事听天命”的事,视频最终播放除了质量不要太差,还要仰赖“算法推荐”是否赏光。“过去的成功是现在的债务”,在不断期望有新的视频打破旧的记录的看似高产的每一天,我终于体验到了被流量推着走的窘境,一种类似脑科学实验中按电门的小鼠一样的焦虑和刺激的不断反复。

所以,如上关于众人眼中的“UP 主”印象正确与否并不重要,重要的是当自己终于走进这一步,“我是‘UP 主’”带来的心理暗示以及连带的播放和数据要求内化,一度反噬了我想要快乐地做视频与人分享的初衷。如果说职业化的暗示带来了什么问题,那便是它让人们在讨论的最开始就排除了单纯用视频表达内容的非经营账号的可能。这不但让加入这个队伍的人感到疲劳,也让想要加入的新人心有忌惮。

对于每个询问过我如何成为“UP 主”的朋友们,我都会说如果不想以它为职业,这就是一个个人的视频分享账号,想要靠创作激励生活也是不现实的。这也是我想要的状态:不要因为考虑播放或粉丝数限制自己的作品范围,也不要因此就追逐热点,回避“冷点”——冷点有时反而已经经典。维持小规模和自由创作正是小创作者们的优势,籍此提高作品的质量,加入同好的分享,偶尔运气不错被算法送到更多人眼前,反而是轻松和保持兴趣的创作态度。况且,我一直是个不想被算法抓住的人。由我这样不在乎粉丝数的人去任何领域里摇摆不定,或许是让仅有的关注者们不断打破算法投喂的最合适人选。

“UP主”只是一个简单的名字罢了。

为什么是视频

我们在一出生就学会了和人沟通,语言是人的“权利”。但语言只能解决面对面的交流,为了跨越时间或空间,人们使用了文字和图画(例如壁画)。人类早就意识到这些理所当然的沟通需要普遍掌握,于是把读书识字放进了公立教育。

从技术角度来说,文字是纸笔时代的记录方式,那自然可以认为视频是网络时代,或者更前的,电视时代的记录方式。网络时代不同于电视时代的或许是人们都有了能够制作视频的设备,使得视频制作和上传对每个人都变得可行。

如果认为视频和文字一样是人类籍由媒介传递信息的工具,那么只有职业化的视频制作才有存在的资格这种事便不会成立。事实上,短视频或许正成为每个人制作各式各样业余视频的方式,才让它在商业上取得了巨大蹿升。

但我们都应该知道,写字表达和使用文字进行“创作”工作,是两件稍显不同的事。在即时通讯软件上聊天和写一篇文章自然是不同的,后者需要创作者具有一定的文字使用能力——例如修辞技能、文章架构的技能——同时具有对怎样的文字是“好的”的审美能力。这或多或少正是语文教育试图解决的问题,不论目前的语文教育结果如何,我们都在学校或家庭教育中面对过阅读和写作技能,并且有意无意进行过相关审美的训练。

但视频呢?

这首先让我想到从前看到过的一种关于“视频”词语用法的讨论。用“视频”来形容我们目前看到的这个东西有些奇怪,它是一个工程中的技术用词,而完全忽略了它背后的内容和故事。例如我们不太会用“音频”称呼音乐,向你的朋友推荐一首“音频”。称它为影片、或日语中的「動画」、或对不同类型的影片称之为“纪录片”、“故事片”等等,都比“视频”更具有“活性”,也更让我觉得它是需要人动用审美的一种创作物件。

另外一点是,影像作品从诞生之初,就和现代意义上的技术绑定在一起——无论是胶片电影或是今天的网络视频。今天的人们学习视频制作,最先想到的是学习什么呢?从我的经验来看,首先是剪辑软件的操作方法、音频去哪里下载、鬼畜视频如何调音……这当然是自然而然的需求,但学习不应该止步于此。或许正是“视频”这个词汇暗示的工程含义和它实际的制作难度,让人们在入门前以为技术是唯一的门槛,但深入其中之后就会发现每一步都必须做出审美上的决策和判断。知道 command + B 是剪断片段并不够,重要的是决定在哪里剪断。这像是演奏乐器并不只是把乐谱上的标记技法展示出来,好的演奏者需要明白它演奏的声音是在表达什么,并在每一处演奏上处理诸如揉弦揉几分、按键按多重、何处渐强何处渐弱等等难以言说的问题。微妙的感受操控和上下文间的起承转合,也常常让我想到职业游戏选手的操作或是书法写作中同字不同形等等类似的事。

说回我自己制作过的视频。即使是看起来最简单的数据统计,依然要考虑柱状图的整体配色协调、图颜色是否能代表所统计的 UP 主、音乐和柱状图切换频率配合、数据变动高潮与音乐高潮的匹配……即使数据处理可以用代码解决,也依然需要为剪辑出最合适的节奏调整一天甚至更久。使用无关素材拼合的二创视频,需要找到语言、语气、长度都合适的话组成合理的剧情,通常素材搜集便需要一周甚至更多……即使是单纯的搞笑视频,一样要考虑包袱节奏是否合适、剧情是否合理,没有任何看起来简单的视频制作方便。

所有这些,都不是技术问题。如果文字写作需要语法和修辞上的训练,那么视频则是几乎完全不同的一套“语法”和“修辞”,毕竟操作的道具都完全更换,使用方法都要从头学起。这些都是学校教育没有教过,但很明显在高度技术媒介的社会中正在逐步变得重要的技能,或许未来教育加入今日作文教育一样的视频教育也说不定。或许短视频被人觉得俗的原因,正是因为我们对于影视作品的期待常常趋于专业化,但短视频制作者们又常常没有或没必要加入审美上的自我要求。

长此以来我都意识到自己图形审美的严重缺失。文字是我从小学习和不断练习过的,音乐虽然没有系统学习过,但也学习了 10 年的乐器,琢磨过其中的好与坏。唯独画与电影,是几近空白的。在不断制作新影片的过程里,慢慢体会和解决理性不能及的审美问题,实在是既困难又令人欣喜。它又常常提醒我反思这个理性和数据决策至上的时代,到底让人缺失了什么。所以,我一直把它当作审美和新的表达技巧的双重训练。

虚拟主播

如果说影片、视频是和技术牢牢绑定在一起的,那 VTuber、Vup,或汉语翻译为的虚拟主播,就是没有技术干脆不可能存在的新东西。

对不知道什么是“虚拟主播”的人解释它,技术上的描述可以是:通过实时的动作捕捉,把真人的动作、表情映射到动画人物身上,观众看到的画面中只有一个“会动会说话的动画人物”,一个介于平面世界和实体世界之间的 2.5 次元。因为最早活跃在 Youtube 上,形容这类频道主的原名词为 Virtual Youtuber,后又简化为 VTuber。

和技术牢不可分的关系不仅体现在它的实现方式上,早期的此类角色——如获得大量人气的日本 VTuber 絆アイ——也被设定为来自数字世界的 AI 角色。这里带来的某种新的默认规则是,卡通角色和扮演角色的人(日语称为「中の人」)被认为是两个人格,至少明面上不公开中之人也是通用规则。最初畅行的 AI 设定,似乎的确是人们对 AI 热情的无限期待构建而来的——在人工智能带来强大冲击的几年,幻想未来的 AI 可以做到一个真人一般的 Youtuber 的想法显得自然而然。很多刚刚接触到 VTuber 的人都会有自然的疑问:“这是真的 AI 吗?”或许正是这样的技术期待带来的设定,让虚拟主播成为独立于中之人的单独人格变得有意义。

但 AI 发展并未如愿,人工智能依然没能成为我们热切幻想中的独立智慧。行业的井喷式发展是由于更实际的技术理由——iPhone X 推出的 3D 结构光摄像头,让某家日本企业研发出了可以追踪人脸表情并投射在虚拟人物上的 App,又因为无法顺利上架 App Store,最后它们变成了经营 VTuber 的最大公司,今天的「にじさんじ」(彩虹社)。新出现的 VTuber 也不再独立设定为 AI,而开始出现了越来越多的动漫人物、现实人物或者索性不是人物的设定,也有更多已经小有名气的频道主“转生”成为一个虚拟主播,让原始的默认规则变得松散。有趣的是,尽管设定人物作为中之人与观众之间永远存在的媒介,但当絆アイ的公司试图更换中之人的时候,粉丝们开始爆发出了“我们喜欢的是中之人而不是设定人物”的声讨浪潮。

这不得不让我对人们对于事物的认知模式产生兴趣。当观众观看着屏幕中的 VTuber 的时候,他们明知道这是真人扮演的假人,但又似乎在把眼前的卡通人物视为行为的发出者,同时又明确知道这些都是背后的某个人类在真实操作的。如果一个角色更换了中之人,会为观众带来显而易见的不适感,往往需要很久的时间才能消除。“灵魂”与身体是绑定的,虚拟主播似乎是把某个人的灵魂嫁接在了一个动画人物上,然后创造了一个新的角色。

虚拟的动画人物在多大程度上影响了人们对主播本人的认知呢?如果去掉了虚拟人物,见到的是实在的人,那么还会有以往的吸引力吗?类似的问题也见诸于对动漫角色的讨论中,如能够在现实生活中找到类似动漫世界里的角色吗?虚拟主播的问题让它更有针对性,角色背后就针对了一个实在的人。在我眼里,视觉印象构成了人们对人物认知的关键要素,画面上描绘出的审美标准和法则是和现实世界中不同的另一条道路——正如作文的语法不能加之于视频之上。而“美”是一种感知要素高于理性要素的人类感受,很难说此一种“美”和另一种“美”能够给人带来相同的感觉。如果不可移植,便不如保留不动。形式如果是“美”的载体,那去除 VTuber 的任何一个要素——无论是动画人物还是真实人物——都会造成对感受的破坏。反过来说,越是相信眼前的假人物是整合统一的独立个体,越是能够理解和感受它带来的独特审美或娱乐体验。

不过,好在这只是某种艺术或娱乐形式,即使相信假的是真的,也不会造成太多现实上的问题。如果它进入我们的日常生活该如何是好呢?例如,如果增强现实眼镜普及开来,那么未来的“VTuber”并不需要今天的平面网络设备,我们每个人都可以定制一个在他人眼中的形象,甚至对不同的人制定不同的对外形象,不用整容便可以把 PS 随身携带,甚至干脆让自己不展示为人形生物。那这样的假到底应不应该被视为真呢?“真”的道德意义究竟是……?他人又有没有权定义我看到他/她的样子呢?过度 P 图的真人主播,反倒比一开始就是假的的虚拟主播更遭受了“真实”带来的问题,其中似乎带着某种“欺骗”与否的意味。

如上的问题着实令我觉得超出了能力范围,科技可能带来的问题和已经带来的问题差不多一样让人纠结,总之姑且先放在这里。

为什么是直播?

继续回到 VTuber 本身。当 Vtuber 开始兴起时,依然是一如既往的视频投稿当道。然而,随着 Stream 或汉语中“网络直播”的发展,让一些在这个领域内领航的大船差点颠倒倾覆——主打直播的主播变得比传统的视频投稿人更受欢迎,让后者的几位先行者甚至几近失去了受众。

如果留意过 Youtube 上的产品设计,它并未把 Stream 和视频做出明确的分野。你可以在关注列表上既看到关注人们的最新视频投稿,又同时展示当前或未来预定的直播活动;结束的直播会自动成为普通视频,和其他视频投稿无区别。这或许是直播出现之后 VTuber 能够继续描述直播和视频两类频道主,而 B 站这里,“UP 主”和“主播”常常是两个不同的词。这也是我觉得只使用“虚拟主播”这个翻译不好的地方,实际上它忽略了只做视频,不做直播的那一部分人。

视频相比直播究竟有什么不同呢?

在直播行业初兴起的时候,我和周围的很多人都无法理解它为什么是受欢迎的,尤其是为什么会有人愿意花大把的金钱打赏原本免费就能看的直播。如果经济学上的“理性人”假定成立,那么直播行业一定是第一个完蛋的行业。好在我们是研究行为经济学的,第一步就是否定“理性人”假定。不如说,直播打赏就是某种变种了的 最后通牒博弈,除了打赏会被人记住,你常常会听到“看节目付费是应有之道”的说法,不如说就是人们对于“公平”有着某种理所当然的想法。

不过我更想比较的是直播相比视频的特点,以及究竟为什么主打直播的 VTuebr 胜过了主打视频的那些。直播的劣势很明显,因为无法剪辑,导致整个直播的节奏都和日常生活相同,无法进行任何处理。这像是限制住了制作者的某些技能,让整个内容只能以某种即时的方式呈现。反过来,这又是它平易近人的地方,因为它是世界上某个地方正在同时发生的,反而带来了非同步内容无法造就的“陪伴感”。在某些时刻,观众甚至可以参与到整个节目当中,使之成为一种可交互的形式,如果尝试过和远在屏幕另一方的的主播交流过,那的确是一种有趣的体验。即时和可交互,听起来又像是电子游戏的某些特性。因为即时性所以不知道下一秒会发生什么,游戏这种强交互的创作形式,总是成为网络直播的好题材。哪怕已知游戏剧情如何演进,但是看一个正在操作它的人,也不会知道下一秒会发生什么有趣的事。类似于体育比赛的直播永远比录播更激动人心,游戏直播往往能够达成类似的效果。更适合直播的还有歌曲演唱,“活着”的音乐比躺在设备或 CD 里的录播文件更好。日语中对直播「生配信」的称呼,正是对于“活着”的一种暗示。直播虽然比不上现场欣赏音乐的程度(顺便一提,皮肤是感受打击乐的一种渠道,单纯地听便是一种折损),但聆听真人演唱总是比聆听录音更好的体验。它包括表演者投入带来的共情,或者明知现场演唱可能出错但演唱者依然毫厘不差的惊喜等等。音乐作品是一种情感沉浸,而非单纯的声音艺术,直播能为它带来更强的“增强现实”体验,因为它就是一个正被共享的现实。

克服直播即时性带来的缺点并非不可能。如果你看过舞台剧也看过电影,就应该明白这回事。事实上,的确有人这么干过,彩虹社所属的 VTuber 月の美兎曾经做过 “投票选出真正的月の美兎” 企划,在屏幕中出现三个相同的虚拟人物,通过播放事先录好的声音搭配实时的多人表演,让观众在推特上猜测哪一个才是真正的自己。可想而知,这必然需要事前的剧本和排练,让整个直播变得像是排演好的舞台剧。不如说,这样的企划甚至是唯独虚拟主播才可能做到的事,实在是活用了虚拟人物、直播和实时互动的所有好处。

直播的确是上限很高,但也带来了更多难度的创作形式,但打开直播间就开始的日常直播让它的下限也变得比视频创作更低。大部分时候,仅靠“实时感”和“陪伴感”就能带来完全不同的观看体验,使得它变得吸引人,甚至吸引人付费给免费内容。或许孤独的人越多,直播带来的“有一个活人在那里”的重要性就越高。

另一面是,今天的 VTuber 多少主要混迹在二次元圈子里。这里有些与众不同的文化,例如二次创作的兴盛让整个圈子的每一个观众既是受众,又可以是创作者。它也让即使是万人关注的主播也和粉丝们保持在不远的距离上,你可以给主播制作二创内容并获得转发感谢,或者给主播寄去礼物,甚至字幕组文化让粉丝有机会成为作品的一手经手人……人人可参与,人人可创造,让小圈子成为去精英化的爱好者共建社群,也正是我喜欢的氛围之一。最成功的那些人一样是一群业余爱好者,不论是唱歌还是游戏都不专业,这样的业余正是它吸引人的地方。即使带着虚拟人设进场,也早晚会被真人的性格取代,如果你觉得明星产业是让人变成包装精美的人形工业品,那时下的 VTuber 们正好走在它的反面。这时时提醒你虚拟形象的背后是一群有着和观众一样生活的普通人,甚至需要去打另一份工维持收入,这让每个作品都充满“人味儿”。非剪辑的直播不是正暗合这样的“我是和你一样的普通人”的意味吗?在这样拉平距离的社群环境里,不经剪辑和修饰的节目受到欢迎可能也就不意外了。

虽然如上讲述了直播形式的优势,但实际上大部分的中文互联网直播依然保持在不高的水平上,能够将直播做好的难度依然很高。这更意味着视频投稿并非没有出路。视频的优势正在精细的制作上,花费三十分钟制作一分钟画面的视频节目,让更深刻、更复杂的内容和画面成为可能。国内最早的虚拟 UP 主团队 小希小桃Channel 今天依然在坚持视频制作,同时能够不停地看出她们在内容深度上的想法。这些直播无法做到的事情,正是视频可以继续发力的地方,也是必须用剪辑视频才可能完成的。能够令观众喜欢的并不是只有一种形式,重要的是选择最合适的。

最后说一点有趣的事。VTuber 作为新兴行业,免不了经常有人无法维持节目,最终离开,在这里被称为“毕业”。等到你喜欢的 VTuber 毕业了,就会发现自己跟本不知道从始至终喜爱的主播究竟是谁,以后这个人便再也找不到了。恰恰因为人物是虚拟的,反倒最终告别得比什么都真实。

尾巴

距离动笔写这些,已经过去了一周时间。如果文字创作要求详略得当,这一定是一篇标杆式的反例。好在作为零碎的随笔,也没有考虑更多行文的问题。不论是做视频 UP 主、做 VTuber 观众,我都游离在群体之外,想做就做、想看便看,并且享受着这样的状态。到底上面写过的东西有几分准确呢?或许把它们当作生活一部分的制作者和观众们更有发言权,不过带着业余视角正是我的优势。我还有其他更感兴趣的问题,比如做 VTuber 的人到底如何认知每天要扮演一个角色的自我呢?不过那是未来的事了。

如果真的有人把这篇无聊的文章看完,实在是不胜感谢。

虽然有些晚了,但祝新的一年,各位愉快~


If you like this blog or find it useful for you, you are welcome to comment on it. You are also welcome to share this blog, so that more people can participate in it. If the images used in the blog infringe your copyright, please contact the author to delete them. Thank you !