每日最新頭條.有趣資訊

依圖科技行為識別算法破世界紀錄,已在智能城市領域落地

2020年8月3日,國內人工智能企業依圖科技宣布在行為識別領域取得突破。在由全球多媒體領域頂級學會ACM國際多媒體會議(ACM MM)主辦的 “大規模複雜場景人體視頻解析”挑戰賽中,依圖科技取得“Track-4:行為識別”的第一名。比賽中,依圖算法的指標將以往學術界中的基準算法提升了近3倍。

行為識別以人為基礎部門,分析人的行為,關注單人的動作以及多人的動作,例如一起走路、奔跑、打架等。因場景複雜多變、動作差異化大、需要捕捉連續動作和長時間動作,行為識別和分析是一項複雜度較高的任務。ACM MM此次競賽注重對擁擠場景的考察和較少見動作的識別,對於人體框定位的精確性要求更高。

與其他成熟的國際競賽不同,這次競賽是首次舉辦,參賽隊伍在賽前無法了解識別的類別、數據集的大小和識別的具體需求,需在短短一個多月的時間內,設計出最優的算法。

依圖科技稱,不同於其他參賽隊伍,其此次沒有使用複雜的多模型融合策略,而採用單模型,借助背景提取和分割算法,將行為的解析與場景結合,降低了問題難度。

視頻中行為識別是挑戰賽的重點項目,目的是考察算法在複雜場景下對行為的解析能力,包括多人追蹤、人體姿態、行為識別等。相較於圖像,視頻的行為識別更加複雜,如何建模、視頻幀之間的相關性是學術界一直存在的難題。在此次挑戰賽中,上百支參賽隊伍參與了超過56000個複雜事件下的人體行為(包括排隊、打架、俯身、同行、跑動、滯留等)的解析。

依圖科技介紹,為解決視頻中行為識別的難題,其將算法與場景進行了結合。一方面從視頻中自動提取場景信息,結合行人檢測、行人重識別算法,構建人與人、人與場景、人與物之間在視頻中的關係;另一方面,借助算法和對行業場景的理解,對比賽中要求的特定的14類任務進行了深度算法優化。

據悉,行為識別的應用可以幫助判斷行人夜晚路遇劫匪而自動報警、在家中老人倒地時及時預警並告知監護人、判斷生產線上的工人施工順序出錯並即刻發出告警,還能在在視頻中對內容進行精準理解,並為其貼上更合適的標簽使得能夠被更精準和更容易檢索到。

目前,這套行人識別算法已搭配其他算法技術在智能城市領域落地應用。

獲得更多的PTT最新消息
按讚加入粉絲團