每日最新頭條.有趣資訊

海天瑞聲:雷軍間接持股 核心技術明顯不足

作者 | 羅蘭

流程編輯 | 安安

4月9日晚間,上海證券交易所披露,新增受理北京海天瑞聲科技股份有限公司(以下簡稱海天瑞聲)科創板發行上市申請。

根據招股書的說明,海天瑞聲是一家人工智能數據資源服務商。在分析這家公司之前,我們先來聊聊人工智能這個行業。

一、昨天和今天

欲深入了解一個事物,先要明確其定義。

人工智能(Artificial Intelligence,以下簡稱AI),是研究開發能夠模擬、延伸和擴展人類智能的理論、方法、技術及應用系統的一門新的技術科學。

簡單說,AI就是一種讓機器能夠像人一樣,會聽、會看、會說、會動、會思考及會學習的技術。

人工智能距它誕生,已有60多年的歷史,其發展的道路充滿曲折與起伏。

1956年,明斯基和麥卡錫等科學家,在美國達特茅斯學院召開學術會議。會上首次明確“人工智能”的概念,AI這門學科,從此正式誕生。

從1956年到20世紀60年代初,AI領域出現一批令人矚目的研究成果,如機器定理證明、跳棋程序等,人工智能迎來第一個發展高潮。

進入70年代,由於對人工智能的樂觀期望,人們開始嘗試一些不切實際的研發目標。然而,接二連三的失敗導致AI系統一直停留在玩具階段,難題並沒有隨著時間推移而被解決,人工智能遭遇了首次低谷。

20世紀80年代,專家系統成為AI研究的焦點,人工智能開始從理論研究走向實際應用。隨著專家系統在醫療、化學、地質等領域取得成功,人工智能又迎來了新的一輪高潮。

到了90年代初,專家系統所存在的應用領域狹窄、知識獲取困難、難以與現有數據庫兼容等問題逐漸暴露出來,人工智能步入第二次低谷。

從1993年至今,互聯網、大數據、雲計算、物聯網及深度神經網絡的發展,加速了人工智能的創新研究。

1997年,IBM的深藍機器人戰勝國際象棋世界冠軍卡斯帕羅夫。

2016年,Google的 AlphaGo以4:1的總比分戰勝圍棋世界冠軍李世石。

人工智能在許多領域不斷取得突破性成果,終於迎來爆發式增長的新高潮。

如同蒸汽時代的蒸汽機、電氣時代的發電機、信息時代的計算機和互聯網,人工智能正成為推動人類進入智能時代的決定性力量。

目前,人工智能產業從架構上分為基礎層、技術層和應用層。

基礎層主要涵蓋數據資源、算力(芯片)、傳感器;技術層則包括算法和其他AI技術;應用層就是AI技術在具體應用場景的商業化。

在AI產業鏈的每一層,都有公司參與其中。

在上遊的基礎層,有大立科技、NVIDIA等。本文研究的海天瑞聲,專注於人工智能上遊的數據資源服務,因而也屬於這一層。

在技術層,則有科大訊飛、百度等。

由於AI的商業化場景非常多,因此在應用領域,有更多的企業參與其中。

據灼識谘詢預測,未來人工智能將逐步在無人駕駛汽車、醫療、零售、家居和教育等領域得到大力推進,助力現有產業的技術更新以及產品升級。

二、算法、算力及數據

談到AI,就不能不提到人工智能技術發展的三大驅動力。

它們分別是算法、算力及數據。

人們發展人工智能技術的目的,主要是讓計算機替代人,完成部分工作。

讓機器像人一樣行動、思考,就必須讓機器像人一樣,接受外界信息,然後反饋輸出,這個過程就需要算法。

如今主流的算法是一種基於多層神經網絡模型的算法,即深度學習。這種算法可以讓機器由低往高,逐層自動學習一些複雜的特徵,解決一些更複雜的問題。

一方面,多層神經網絡,結構複雜,參數眾多,模型的生成需要大規模的數據;另一方面,機器面臨的現實情況不斷變化,算法需要不斷訓練、優化升級,這一過程也需要數據。

因此,沒有數據,再好的算法也很難進行有效升級。

數據用來訓練算法的這個過程俗稱“喂數據”。在“喂數據”的過程中,由於所用數據規模龐大,訓練的多層神經網絡模型異常複雜,如果計算機的處理速度跟不上,則花費的時間將會非常長,降低效率。

所以,硬體上的算力(計算能力)對人工智能技術的實現也是至關重要的。

如果把一項成熟的AI技術比作一道菜肴,那麽數據是食料,算法是炒、煎、熬、煮、燉等各種烹飪方法,算力則是燃氣灶、菜刀、鍋、杓等烹飪工具。要想做出一道色香味俱全的菜肴,三者缺一不可。

三、行業基本面

根據清華大學《中國人工智能發展報告2018》,全球人工智能產業規模在2018年已達2700億。

目前,中國已經成為全球人工智能領域的重要一極。到2020年,中國的人工智能市場規模將接近1000億。儘管增速放緩,但行業仍在高速發展,人工智能熱潮逐漸回歸理性。

從全球人工智能企業分布圖來看,中國(不含港澳台地區)人工智能企業總數1011家,位列全球第二,僅次於美國。

四、主營業務

海天瑞聲有三大主營業務,分別是數據資源定制服務、數據庫產品和數據資源相關的應用服務。

近三年,數據資源定制服務及數據庫產品兩項收入合計佔營業收入近99%。

兩者毛利潤合計佔比也是超過95%。

數據資源定制服務和數據庫產品業務,都是公司先采集、標注數據,然後交付給下遊客戶,供他們訓練算法模型。

兩者唯一的區別是:前者是按照客戶要求,提供定製化的數據資源,後者則是公司自己開發的標準化數據庫產品。

儘管業務領域涵蓋了智能語音、計算機視覺、自然語言等人工智能核心領域,但海天瑞聲主要做的還是數據方面的服務,屬於產業鏈的最上遊,不涉及算法以及算力。

從數據資源定制服務的細分領域的收入來看,智能語音數據資源的銷售是主要收入來源。

數據庫產品銷售情況也是一樣,智能語音領域為收入貢獻最多的數據庫產品領域。

由此可見,公司提供的數據主要是語音數據,即音頻製品。

換言之,公司主要為各大智能語音平台提供“原料”,提供語音語料數據資源。

人工智能的應用領域眾多,有很多細分產業。而海天瑞聲基本屬於AI裡的智能語音行業。

根據《2017-2018中國智能語音產業白皮書》, 2017年中國智能語音產業規模達到105億元人民幣,增長率達到70%,預計2018年產業規模將達到159億元人民幣。

海天瑞聲是中國智能語音產業中市場份額前十名的企業,也是唯一入圍的數據資源服務企業。在智能語音產業的上遊,海天瑞聲處於領導地位。

除了按產品分類,我們還可以按區域將公司主營業務收入分類。

報告期內,公司存在一定規模的境外收入,其中以日本、韓國、美國等地區為主,佔主營業務收入的比例大約在三分之一。

五、成長性

2016-2018年,公司營收增長情況良好,2017和2018年分別同比增長42%和62%。

細分業務來看,公司兩大主要業務的增長情況均保持良好。

2017 和2018 年,數據資源定制服務收入分別同比增長40%和97%,數據庫產品收入分別同比增長45%和20%。

由於公司所處行業正在高速發展,同時,數據資源定製化服務需求增長迅猛,遠超數據庫產品需求,從而使前者在2018年,成為公司第一大業務。

近三年,公司淨利潤和經營性現金流淨額也在大幅增長。2017年的增長率高於2018的原因主要是2016的基數小。而2017年淨利潤增長率明顯高於經營性現金流淨額,主要是因為2016年計入股份支付費用591.6 萬元導致淨利潤顯著下降。

除開2016年的特殊情況,公司淨利潤與經營性現金流淨額基本匹配,增長的質量較好。

六、收入與支出

公司的收入模式有兩種,分別是服務費和授權使用費。

對數據資源定制服務、數據資源相關的應用服務等業務,公司向客戶收取的是服務費,比如與三星電子簽訂的合約,而對數據庫產品業務,公司收取的是授權使用費,比如與阿里巴巴簽訂的合約。

值得注意的是,數據資源定制服務和數據資源相關的應用服務裡,出售的數據是轉移了所有權,而銷售數據庫產品時,公司並不轉讓該數據庫的所有權,只是讓渡使用權。

報告期內,公司存在一定比例的預收款項和應收账款。前者是由於部分客戶存在預付一定比例項目定金而導致,後者是因為公司制定了銷售管理的相關制度,給予客戶不同的銷售信用期所致。

數據服務費是公司最主要的支出項目。近三年,其佔公司採購總額的比例維持在60%以上。

根據招股書的定義,數據服務費是公司在提供數據資源服務過程中所需的、非核心技術環節的生數據采集、標記服務。

如果不理解這項費用,我們可以看看公司的主要供應商。

下圖是2018年公司前五大供應商名單,2016和2017年的情況也差不多。公司主要的供應商是人力資源服務公司,顯然,數據服務費其實就是人工成本。人工勞動力主要來自這些人力資源服務公司。

在公司的招牌廣告上,某些職位的要求就是音頻數據采集(錄音)和標記服務。

比如,中文韻律標注員的職位要求。

再比如,德語坐班校對(公司存在一定規模的境外收入)。

公司聲稱上述採購環節主要為基礎性、重複性的人工操作,需求量隨業務量及業務結構波動,且所需人工較多,采取對外採購形式具備合理性。

這句話可以理解為,從人力資源公司雇傭的員工不算公司的正式員工,他們從事的是簡單重複性的錄製音頻、標注工作,沒有多少技術含量。

這也就是為什麽公司把這些工作當成非核心技術環節的原因。

七、毛利率和淨利率

由於同處智能語音產業上遊,以銷售數據為主的公司,國內沒有一家是上市的,風雲君無法對公司進行真正有意義的同行對比。故這裡隻做縱向比較。

2016-2018年,公司整體毛利率變化不大。

其中,標準化數據庫產品的毛利率比數據資源定制服務高,這符合常識,因為標準化產品可以重複銷售,導致邊際成本為零,例如微軟的office系統、同花順的炒股軟體都是很高的。

然而數據庫產品毛利率100%?這就奇怪了,說明可能存在收入和成本匹配的問題,估計發審委也會問到這點。

公司的解釋是,數據庫產品所發生的支出在當期全部計入研發費用,無相應的營業成本故毛利率為100%。

理論上數據庫產品的開發費用應該放在營業成本,但放在研發費用也正常,國內很多軟體上市公司也是這樣處理的。但數據庫產品難道不需要原始數據採購、後期維護、設備折舊、伺服器託管等費用?這些費用都是營業成本。

再來看看淨利率,2016-2018年,公司淨利率穩步增長,同期的期間費用率則是逐漸下降。

從各項期間費用來看,佔大頭的管理費用率和研發費用率下降是導致期間費用率下降的主要原因,也是導致公司淨利潤率上升的主要原因。

公司以直銷為主,不存在經銷商銷售,故銷售費用率保持較低水準。

八、業務獨立性

根據一些被發審委否決的IPO案例,過分依賴單一客戶、供應商、政府補貼,常表明公司獨立性上有缺陷,是擬上市公司核準過會的“殺手”。

公司主要的下遊的客戶以阿里巴巴、騰訊和三星為主,上遊以廣州善世和蕪湖善慧人力資源公司為主。

近三年,公司前五大客戶銷售收入佔營業收入的比例逐漸上升,目前已超過50%。前五名供應商的採購額佔同期採購總額的比例也已高達72.54%。

很明顯,公司的下遊客戶集中度過高,上遊供應商集中度也過高。

報告期內,公司獲得的政府補助均屬於與收益相關的政府補助,其中,增值稅即征即退補貼款是最主要的政府補助。

2016-2018年,政府補助佔淨利潤的比例不高,在10%到20%之間。公司的盈利能力對政府補助的依賴性較小。

九、融資與股權結構

2017年,公司流動資產為1.27億,較2016年的0.56億大幅增加。

導致流動資產增加的主要因素是其他流動資產大幅增加。

2017年公司的其他流動資產為7530.63萬元,佔流動資產比例近60%。而2016年,其他流動資產才74.64萬,佔比只有2%。

其他流動資產裡,佔大頭的則是銀行理財產品(如下圖)。

公司解釋說,銀行理財產品增加的主要原因是經營活動現金積累和外部增資所致。

2017年的經營性現金流淨額為3469.16萬元,加上當年吸收投資收到的現金4050萬元,基本與7500萬元的銀行理財產品一致。

查閱公開資料,公司確在2017年融過資。

目前,小米科技、興富資本、銀杏谷資本、士蘭創投合計持有14.4%的海天瑞聲股權。

由於在2017年對外融資,淨資產增加,公司的加權平均淨資產收益率(扣除非經常性損益)有所下降。

公司共有10名股東,其中2 名為自然人股東,2 名為員工持股平台,6 名為機構股東。

這十大股東的背後有多家上市公司的身影,包括小米。

十、科技成色

科創板面向的是科技創新型企業,申請掛牌上市的企業需要符合科創板定位。擬上市的企業要具備一定的科技創新能力,且屬於高新技術或戰略新興行業。

那麽。海天瑞聲的“科技成色”如何?

截至 2018 年12 月31 日,公司現有技術人員57名,研發人員31名,兩者合計佔員工總數的比例達69.29%。

2018年,公司本科及以上員工佔比95.28%,碩士及以上員工佔比34.65%。

公司核心技術團隊包括唐滌飛、李科、郝玉峰、黃宇凱、曹瓊、邵志明。近兩年,團隊未發生重大變動。

團隊成員均為計算機等領域的專業人士,擁有豐富的人工智能行業經驗。

為了維持核心技術團隊穩定、保持科研人才的活力、保障持續創新能力,公司除了在薪酬方面對其傾斜,還設立了中瑞立、中瑞安兩個員工持股平台,對其實施股權激勵。

2016-2018年,公司平均的研發費用率為20%左右。

研發費用裡有一項是數據服務費,佔比超過三分之一。

該費用是開發數據庫產品過程中,用於對非核心技術環節的生數據采集、標記服務的支出。

前文已說明,該費用實際是支付給人力資源公司的人工費,且雇傭的人員做的是錄音及標注工作,不屬於研發人員。

根據《高新技術企業認定管理工作指引》的相關規定,某些費用及活動是不能計入研發費用的。

從上圖可知,數據服務費是不能歸入研發費用的。

如果除開研發費用裡的數據服務費,那麽公司近三年的研發費用率接近10%。

知識產權方面,公司已有自有知識產權數據庫產品500余個,取得92項計算機軟體著作權,另有8 項發明專利正在申請中。

從公布的軟體著作權以及在申請專利來看,大部分技術是用於語音數據采集與處理環節。可見,公司的核心技術主要體現在錄製及標注語音數據方面。

不過,正如前文所述,錄製音頻數據環節,需要大量廉價勞動力,這也是公司經常大規模招兼職的原因。

如果公司真的掌握數據采集及標注環節的核心技術,那麽,為什麽這個環節體現的基本是勞動力密集,沒有技術含量的工作?這是公司特有的現象,還是行業上遊的普遍現象?

公司擁有的核心技術對公司業績的提高有什麽實質性的幫助?幫助的程度有多大?

另外,著作權和專利是兩種不同的知識產權形式。

具體而言,軟體著作權是在軟體創作完成後產生的,即使沒有進行軟體著作權登記,該權利一樣產生效力。而專利必須向專利局提出申請才能獲得。

保護力度方面,軟體著作權只能保護軟體中的一串串代碼,無力保護軟體中最核心的東西:構思。

其他軟體開發人員可以按照原創者的構思,採用不同的編程語言編寫,這樣就不存在對著作權的侵犯。

因此,軟體專利的保護力度比軟體著作權的保護力度大的多。而公司目前以軟體著作權為主,技術壁壘顯然不強。

在招股書中,公司列舉出來的三個同行企業,分別是Appen、慧聽科技、標貝科技。

但公司沒有披露自己與競爭對手在技術水準方面的差異,也沒有披露行業內最先進的技術水準以及這些技術的迭代周期和可替代性。

總體而言,就目前披露出來的信息看,公司的科技成色略顯不足。

十一、募投項目分析

公司本次計劃發行1000萬股,募集資金將用於以下項目。

“天籟”自主研發產品擴建項目主要用於擴大數據庫產品的儲備量,一體化技術支撐平台建設項目著眼於現有技術的升級。

研發中心建設項目主要用於前瞻性技術儲備,業務管理平台建設項目用於提高業務管理水準。

四個項目合計投入6.3億,其中,用於購置房產的4.06億,佔比高達65%。

這些房產位於北京市海澱區中關村、上地區域。項目實施過程中將新增大量固定資產,而固定資產有巨大折舊風險,但公司沒有披露新增固定資產折舊對未來經營成果的影響。

除了上述四個募投項目外,公司還將募集1個億的資金,用於補充流動資金,優化資本結構。

然而,從公司的流動性指標來看,海天瑞聲並不差錢,账面上還躺著7500萬銀行理財以及4657.15萬銀行存款。

2016-2018年,公司的資產負債率基本在20%左右,且負債項目主要是預收款項和應付職工薪酬。公司近三年內也均無利息費用支出,沒有任何銀行借款等有息負債。公司籌集1個億用來補充流動性的理由不充分。

十二、結束的開始

人工智能是一個正在高速發展的行業,而這,是海天瑞聲最大的基本面。

儘管一些關鍵性的財務性指標表現良好,公司主營的數據資源業務對AI技術的應用也的確至關重要。

但作為一家人工智能領域的企業,公司並沒有展現出應有的科技創新能力或者潛力,技術護城河明顯不足。

本文已然結束,但海天瑞聲的路,恐怕才剛剛開始。

獲得更多的PTT最新消息
按讚加入粉絲團