2016年7月26日上午,一封上線通知發送到了中國移動通信集團的所有部門,這標志著由中國移動蘇州研發中心自主研發的OA搜索系統正式在集團范圍內上線試用。
OA系統是移動內部最常用的辦公信息系統,系統使用者們對于公文的搜索功能要求很高,且由于集團OA系統數據量龐大,公文種類繁多,對于底層數據的抽取整合、重新建立索引的工作量也非常大。蘇州研發中心大數據部搜索引擎組的小伙伴們,通過近半年的辛苦奮斗,終于克服種種困難,將OA搜索系統成功上線啦!

在本次項目過程中,最大的困難來源于數據源種類多,數據量大,且由于底層數據庫建設時間久遠,所以缺乏文檔和技術類支撐。在比較艱難的情況下,大數據部搜索引擎組的小伙伴們共完成配置文件1萬余行,配置文種30大類,254小類,數據抽取共計30余萬條,建立清洗規則80余條,最后成功“啃”掉了底層數據這個大難題,玩兒轉了底層老舊的數據庫。有了數據,那么剩下的問題就是用我們蘇小研的搜索引擎產品BC-SE構建搜索系統啦!
說到構建搜索引擎系統,這絕對是蘇小研的BC-SE產品的強項:分布式的搜索引擎系統架構、豐富的搜索接口、優化的中文語義理解模塊、高效的搜索流程設計等等,這些都是BC-SE的必殺技!同時,區別于市場上其他的企業級搜索引擎,BC-SE提供了優質的搜索運營服務功能,提供搜索熱詞查詢、高級搜索后臺配置、結果置頂/屏蔽、多租戶管理等搜索運營服務,將搜索能力以平臺化、能力化提供,可以為其他信息系統提供方便、快捷、一站式的搜索服務。

這次蘇小研為集團提供的OA搜索系統,采用了先進的分布式搜索引擎架構,同時在系統中加入了具有移動特色的中文詞庫優化搜索分詞效果(詞庫是由BC-SE的“新詞發現”功能通過自然學習算法提煉出來的哦!),提供了基于相似度、時間、組合篩選條件等豐富的搜索接口,且搜索響應時間基本穩定在100ms以內,從搜索效果和搜索速度上均滿足了日常用戶對于OA公文搜索的需求。

在本次OA搜索項目開發上線過程中,蘇研北京技術支持中心也給予了大力的支持和配合,北支的小伙伴們和大數據部的小伙伴們一直緊密合作,全力解決線上線下的各種問題。同時,也要感謝政企公司的小伙伴,從中協調資源,推進項目進度。大家一起奮斗的感覺,真的很好!
未來蘇小研的搜索引擎團隊,將會更加致力于搜索效果和搜索系統架構的優化工作,為各類信息系統提供穩定、高效的搜索服務,做最好最穩定的企業級搜索引擎!