機器學習幫助發現抹香鯨的“字母表”

麻省理工學院CSAIL和CETI計畫的研究人員認為他們已經在機器學習技術的幫助下解開了一種抹香鯨的字母表。 根據這項名為“抹香鯨發聲中的語境性和組合結構”的研究結果,我們對鯨類的溝通理解取得了重要突破。

這項研究涉及到代碼 - 一系列具有不同語言功能的點擊聲。 “我們發現的是代碼結構存在之前未描述的變化,” CSAIL主任Daniela Rus告訴TechCrunch。 “我們發現代碼類型不是任意的,而是形成了一個新發現的組合編碼系統。”

儘管鯨魚的發聲一直是研究的主題,但這個新研究背後的團隊建議他們已經揭示了喋喋不休的海洋哺乳動物之間的以前未知細微差別。 該論文指出,先前的研究已經注意到150種不同的抹香鯨代碼。

“其中的一部分已經被證明可以編碼有關呼叫者和家族身份的信息,”它解釋道。 “然而,關於抹香鯨溝通系統的幾乎所有其他問題,包括它的結構和信息攜帶能力的基本問題,仍然是未知的。”

這個團隊從去世的開創性海洋生物學家羅杰·佩恩(Roger Payne)的研究中獲得了靈感。 佩恩最具影響力的工作涉及座頭鯨的歌曲。 “他確實激發我們想要使用我們最先進的技術來更深入地瞭解鯨魚,”Rus說。

這個團隊利用機器學習解決方案來分析由研究人員Shane Gero在小加勒比海島多米尼克(Dominica)海岸收集到的8719個抹香鯨代碼的數據集。

“我們將獲得的輸入,然後我們調整我們的機器學習,以更好地視覺化並了解更多,”Rus解釋道。 “然後我們將分析生物學家的輸出。”

團隊的方法標誌著與以前的分析相比的轉變,以研究各個曲碼。 當聲音被研究為鯨魚之間的交流時,形成了更豐富的圖景。 使用音樂術語對上下文細節進行分類,包括節奏、節奏、裝飾和rubato。 然後,團隊隔離了他們所稱的抹香鯨語音字母表。

“這種語音字母表使得能系統地解釋觀察到的代碼結構中的變化,”Rus說。 “我們相信這可能是在人類語言之外的第一個例子,其中溝通提供了一個語言概念的例子——模式的兩重性。 這是指一組個別無意義的元素可以組合在一起形成較大的有意義的單位,有點類似將音節組成單詞。”

這些“詞語”的含義取決於不同的上下文。 論文補充說道:

我們的結果表明,抹香鯨的發聲形成一個復雜的組合式溝通系統:表面上任意的代碼類型可以通過節奏、節奏、rubato和裝飾特徵的組合來解釋。 在自然界中,大規模的組合發聲系統是極其罕見的; 但是,抹香鯨的使用表明它們不是獨有的人類,可以源自截然不同的生理、生態和社會壓力。”

儘管這一突破對所有人來說都是令人興奮的,但還有很多工作要做,首先是與抹香鯨合作,然後可能擴展到其他物種,如座頭鯨。

“我們決定去研究抹香鯨,因為我們有豐富的數據集,而且我們有可能收集到更多數據集,”Rus說。 “此外,因為點擊聲形成了一種離散的溝通系統,所以比起連續的溝通系統,分析要容易得多。 但是,即使羅傑·佩恩的工作也顯示座頭鯨的歌曲並不是隨機的。 有一些段落被重複,那裡有有趣的結構。 我們只是還沒有做深入研究。”