苦逼的視頻制作者需要什么樣的黑科技

時(shí)間:2015-08-25 14:24:19 來源:北京中視英躍文化傳播有限公司 作者: 點(diǎn)擊: 0

作為在線教育行業(yè)中的一份子,無形中總有一種使命感。畢竟目前在線教育行業(yè)如火如荼,人們對學(xué)習(xí)的欲望似乎空前高漲,坐地鐵都能看到旁邊的小伙子手捧手機(jī)不是在追《花千骨》,而是在看《Java進(jìn)階教程》,吾不禁深感欣慰。

       和整個(gè)行業(yè)急速發(fā)展相對應(yīng)的,卻是我們視頻制作者工作量的與日俱增。越來越火的行業(yè),意味著越來越多的需求,每天坐在電腦前面對成堆的項(xiàng)目片段十指齊飛的時(shí)候,我都會(huì)深深思考:就沒有什么黑科技能解救我們這些苦逼的視頻制作者嗎?

苦逼的視頻制作者需要什么樣的黑科技

       其實(shí),還真有。

       圖像識別自動(dòng)選取素材

       巧婦難為無米之炊,做視頻最需要素材片段。但是當(dāng)我們準(zhǔn)備好了大部分素材剛好差一個(gè)特寫片段,或者需要在大段大段的視頻里去找某一個(gè)鏡頭的時(shí)候,那種無處可搜的感覺真的讓人抓狂。

       如果能用圖像識別技術(shù)去搜索視頻——當(dāng)然現(xiàn)在的圖像識別還遠(yuǎn)遠(yuǎn)不夠智能,它們連一只貓都要認(rèn)半天(但是認(rèn)裸體不雅照已經(jīng)頗有心得,參看《Isitnude-網(wǎng)站中的終極“鑒黃師”》),如果靠圖像識別找素材已經(jīng)值得期待,那時(shí),搜素材就會(huì)和搜詞一樣簡單,甚至一個(gè)Ctrl+F就能解決。

       谷歌黑科技自動(dòng)剪輯

       前段時(shí)間谷歌出了一款黑科技:可以把一系列照片無縫組合成為視頻,甚至聯(lián)想補(bǔ)充出原本沒有的畫面。如果此技術(shù)成熟應(yīng)用到視頻領(lǐng)域,到時(shí)我們只要把必要的素材片段導(dǎo)進(jìn)去,就可以直接生成完整的視頻啦。對于那種訪談、演講、培訓(xùn)類鏡頭固定的視頻,簡直能達(dá)到流水線作業(yè)水平。

       語音識別自動(dòng)加字幕

       字幕看似是一個(gè)可有可無的東西,對一些人卻有著特殊的意義。曾經(jīng)有個(gè)聽障人士就問我,能不能有這么一個(gè)軟件,在播視頻的時(shí)候,下面就直接出來了字幕?因?yàn)樗牪坏健?/p>

       居然還真有公司做出來了,就叫“字幕大師”。據(jù)說純智能操作,無需手工調(diào)整字幕:把音頻和文本導(dǎo)進(jìn)軟件,根據(jù)語音識別技術(shù)就會(huì)自動(dòng)幫你對齊發(fā)音與文字,不用自己拖調(diào),最后導(dǎo)出的就是帶時(shí)間軸的字幕文件,簡直跟面包機(jī)一樣的操作模式。語音輸入我們已經(jīng)司空見慣,這種字幕生成軟件其實(shí)采用的是同樣的技術(shù)。語音識別本身就是把聲音轉(zhuǎn)換成文字,用此技術(shù)做時(shí)間軸,甚至能逐字對齊,簡直大材小用。可惜現(xiàn)在國內(nèi)外語音識別還不夠成熟,如果真能達(dá)到100%的準(zhǔn)確率,甚至能純靠對白識別出文字,完全摒棄文本,那才是真正的黑科技。

視頻點(diǎn)
視頻點(diǎn)