公司主要業(yè)務為科技成果標準化評價體系的培訓和咨詢等,參與制定行業(yè)標準,并且是行業(yè)國家標準的主要完成人。每年培訓場次100+,涉及全國50余省市。圍繞推動科技成果轉化,推動新質生產力的發(fā)展,通過有效的技術手段來實現“產業(yè)側的技術需求”與“高校側科研成果”的精準匹配,而實現以文本為載體的需求和成果的語義表征,必然遭遇來自“一詞多義”的挑戰(zhàn)。 通過評估相關詞匯之間的相似度,可以進行文本分類、模糊搜索、智能匹配、增強人機對話的理解,還能用于知識圖譜構建及知識增強。隨著基于內容的推薦技術的快速發(fā)展和廣泛應用,內容的關鍵詞提取和降噪消歧成為推薦性能優(yōu)劣的關鍵因素,雖然有一些研究通過擴展短文本的詞義或描述文本來增強語義,但大部分模型在做信息的加法,而很少考慮進行不相關或者弱相關信息的過濾,往往難以取得很好的性能。多義性是NLP、機器學習中常見的挑戰(zhàn),而中文的語義分析更為復雜。為了更加準確的語義描述,信息擴展的方式在很多方法中被采用,但由于大部分模型在做信息的加法,而很少考慮進行不相關或者弱相關信息的過濾,往往難以取得很好的性能。本文提出了一種基于互場景感知與多模態(tài)增強的表征方法,通過擴展詞對中的詞典、描述文本、以及圖片信息,分別在各個模態(tài)下進行相似度比較,將相關性較弱的擴展信息進行基于場景化的過濾降噪,再將三種模態(tài)數據進行融合比較,在五個公開的數據集中證明了本算法的優(yōu)越性。