10 個詞就能創造「語音分身」!東芝「COESTATION」用AI 輕鬆複製你聲音 – news (新聞發布)



▲東芝在 TOSHIBA OPEN INNOVATION FAIR 2017 上,展示自家的語音平台「COESTATION」。(圖/翻攝自 Robot Start)

陳建鈞/綜合報導

要複製一個人的聲音,竟然是件這麼簡單的事!根據《Robot Start》報導,東芝近期在 11 月 9、10 日舉辦的「TOSHIBA OPEN INNOVATION FAIR 2017」上,展示自家研發的「COESTATION」(COE 意指日文中的「聲」),能藉由短短 10 個詞,捕捉人聲特徵,進而複製出你的聲音。

Robot Start》指出,一般的語音合成功能,會需要使用者錄製大量語句,但 COESTATION 只需要使用者朗讀約 10 個詞長度的特定文句,利用這少少資訊就能複製出你的聲音。

▲合成的聲音能應用在工作、學習、遊戲等各種領域。

使用時,只要傳送想要朗讀的句子、文章到機器人或語音助理之類的載體,就能讓「語音分身」代勞,即時用你希望的對象聲音念出來;且由於聲音製作時間相當短暫,合成出各式各樣的聲音,可說是相當簡單。

不過,因為只是簡短的文句,所以沒捕捉到聲音特徵,而合成出不夠相似的聲音,也是有可能發生的事,遇上這種狀況時,只要朗讀更多字符,就能讓「語音分身」逐漸與自己越來越接近!

「COESTATION」是東芝以自家 AI「RECAIUS」的語音合成技術為基礎,於 2017 年 7 月發表的語音平台。

在東芝的構想中,COESTATION 將成為「聲音交易」的媒介,配音員或藝人可藉由朗讀特定字符,讓 AI 進行學習,創造出你的「語音分身」,當遊戲、動畫公司需要為角色配音時,只要到 COESTATION 購買聲音即可,甚至不用請本人到場。

▲東芝構想 COESTATION 能成為聲音交易的媒介。(圖/翻攝自 Cnet)

除 COESTATION 外,TOSHIBA OPEN INNOVATION FAIR 2017 的展場內,還擺設了超卡哇伊的「KIBIRO」、東芝自行研發的「ApriPetit」等聊天機器人,以及即將在北美地區發售的智慧喇叭「TH-GW10」,甚至台灣公司和碩聯合科技,也在場內展示了自家研發的新型智慧喇叭。

▲左起為和碩聯合科技的自製智慧喇叭、「TH-GW10」、「ApriPetit」。

即將販售的「TH-GW10」」外型成圓筒狀,搭載攝影機,能夠辨認對話者的長相,以及識別條碼,如果擔心安全性問題,TH-GW10 允許消費者透過轉動機身,在不必要時隱藏鏡頭,使用上更安心。

▼TH-GW10 的鏡頭能透過旋轉隱藏,讓使用者更安心。





こんな記事もよく読まれています




コメントを残す