北大方正集團數字出版技術國家重點實驗室年度會議召開
11月28日,數字出版技術國家重點實驗室在方正大廈召開了2019年度學術委員會會議。會議由計算機科學家、中國科學院院士、中國在人工智能和知識工程領域的開拓者、學術委員會副主任陸汝鈐院士主持。
實驗室主任湯幟作2019年度實驗室工作報告。報告對實驗室本年度主要科研項目的研究進展、開放課題和對外交流合作等工作進行了梳理匯報,對2020年版面理解、自動化排版和知識服務三大研究方向進行了部署和展望。研究成果方面:
1)版面理解團隊以結構化文檔和計算機視覺算法為主要研究方向,基于版面的結構識別研究,提供帶有結構化邏輯信息并便于二次加工的數字資源數據。目前該技術已經在方正電子期刊加工、方正國際金融影像識別等實際應用場景中提供了高可靠性服務,為學術研究和產業應用提供了新的思路和方法。
2)自動化排版團隊對XML排版系統進行了細節優化、能力增強和應用拓展,新增了輸出交互式PDF、版本校次對比、網刊移動發布等功能。XML排版系統已被納入行業技術標準中,完成了圖書、專業手冊、試卷等近300本刊物的正式生產和試用。
3)知識服務團隊的研究成果——“錯別字、語法錯誤、標點單位符號等錯誤糾正模型”即將在智能審校系統上應用;針對新聞文本分析的地域識別、新聞相似度評估、新聞情感分析、新聞影響力評估算法模型等技術也即將在融合媒體業務中應用。
實驗室建設方面,除硬件擴充和人才隊伍培養外,實驗室還參與承辦了多場學術交流會議,包括在NLPCC學術會議中承辦的“智能審校”技術專題論壇,并獲得大會“最佳合作伙伴獎”。在湯幟的工作總結報告后,各研究方向的負責人對具體研究成果和應用情況進行了詳細的匯報演示。
聽取匯報后,學術委員會委員們對實驗室一年來的工作成果表示了肯定,并和與會人員針對具體技術問題進行了充分探討。陸汝鈐院士建議實驗室積極探索“出版”新模式,在做好現有技術的同時,研究重心向知識工程方向傾斜,并將出版領域的技術成果不斷拓展至其他應用領域。其他學術委員也分別從成果開放共享、技術轉化及產業化落地、加強內外部宣傳等方面為實驗室提出了建議。
方正信產集團代理CEO左進在會中表示,2019年重點實驗室在北京大學王選計算機研究所湯幟老師的領導下和各位學術委員的指導下取得了一定的科研成果。方正集團秉承王選院士“科技頂天、市場立地”的理念,始終致力于原創性研發,以掌握核心技術、創造市場價值作為企業發展的根本動力,未來也將繼續加大力度推動實驗室和科研院所更深入的合作,支持協同承擔更多的國家科技項目,爭取更大的成績。
經過本次會議,實驗室進一步明確了下階段的工作方向和目標:在現階段工作成果的基礎上,實驗室將進一步聚焦研究領域,不斷提高研究水平和研究能力,積極參與行業標準制定工作,抓緊產品落地并實現產業化,為行業技術進步貢獻力量。