8月21-25日,以“全媒體、高質(zhì)量、新業(yè)態(tài)”為主題的第九屆中國數(shù)字出版博覽會(huì)在京舉辦。
在本次數(shù)博會(huì)上,方正電子作為傳媒出版領(lǐng)域領(lǐng)先的提供商和服務(wù)商,展現(xiàn)了深耕行業(yè)30余年的專業(yè)積淀和創(chuàng)新技術(shù)成果,研發(fā)的“智能排版技術(shù)”還摘得2018-2019年度數(shù)字出版“創(chuàng)新技術(shù)”獎(jiǎng)項(xiàng)。
與此同時(shí),在大會(huì)的三場分論壇上:“人工智能發(fā)展論壇”、“2019智慧教育發(fā)展國際論壇”、“第三屆期刊融合發(fā)展高峰論壇”,方正電子數(shù)字出版產(chǎn)品事業(yè)部產(chǎn)品總監(jiān)楊勇、方正集團(tuán)數(shù)字出版技術(shù)國家重點(diǎn)實(shí)驗(yàn)室高級(jí)算法研究員謝海華、方正電子數(shù)字出版產(chǎn)品事業(yè)部產(chǎn)品總監(jiān)周坤、方正電子知識(shí)服務(wù)事業(yè)部產(chǎn)品運(yùn)營及推廣總監(jiān)趙婧以四場精彩的演講,系統(tǒng)的呈現(xiàn)了方正電子深耕數(shù)字出版領(lǐng)域的創(chuàng)新與實(shí)踐成果。
No.1人工智能發(fā)展論壇
如今,中國的人工智能產(chǎn)業(yè)在全球浪潮推動(dòng)下,已經(jīng)進(jìn)入一個(gè)嶄新的時(shí)代。
在這次由方正電子協(xié)辦的人工智能發(fā)展論壇上,來賓們圍繞人工智能國內(nèi)外理論與實(shí)踐,積極交流人工智能在出版業(yè)應(yīng)用的經(jīng)驗(yàn)與進(jìn)展情況。
方正電子數(shù)字出版產(chǎn)品事業(yè)部產(chǎn)品總監(jiān)楊勇及方正集團(tuán)數(shù)字出版技術(shù)國家重點(diǎn)實(shí)驗(yàn)室高級(jí)算法研究員謝海華,分別從實(shí)際應(yīng)用及底層技術(shù)的角度,呈現(xiàn)了方正電子將AI用于出版的最新成果——“智能編校排系統(tǒng)”。
AI助力智能審校
方正電子數(shù)字出版產(chǎn)品事業(yè)部產(chǎn)品總監(jiān)楊勇
楊勇表示,目前,方正電子依托國家數(shù)字出版重點(diǎn)實(shí)驗(yàn)室,結(jié)合人工智能相關(guān)技術(shù),如詞法分析、句法分析等等對(duì)這套系統(tǒng)進(jìn)行了改良再開發(fā),已經(jīng)將人工智能的成果切切實(shí)實(shí)地落到圖書的日常生產(chǎn)中。
方正智能審校能夠輔助編輯人員發(fā)現(xiàn)知識(shí)相關(guān)、格式相關(guān)、語境相關(guān)等常見及疑難問題,幫助編輯處理稿件中常見的知識(shí)類、格式類錯(cuò)誤,讓編輯把精力更多地放在內(nèi)容本身以及學(xué)術(shù)上面,從而保證圖書質(zhì)量,提升審讀效率。
系統(tǒng)主要包括四部分功能:
■字詞類審校
包括常見敏感詞,錯(cuò)別字,異體字,“的、地、得”等常見錯(cuò)誤檢查。也包括基于人工智能的易混淆詞和搭配不當(dāng)檢查。
■邏輯體例審校
包含上下文查重、大綱、數(shù)學(xué)公式、圖表序號(hào)的檢查。
■格式審校
包括對(duì)千分位、全半角、標(biāo)點(diǎn)符號(hào)的檢查。
■知識(shí)性審校
有針對(duì)性地面向不同學(xué)科領(lǐng)域,如面向人文社科類的歷史紀(jì)年檢查、面向自然科學(xué)的拉丁學(xué)名檢查、面向行業(yè)的術(shù)語譯文檢查、名言警句檢查等等。
這套系統(tǒng)的開發(fā)背景,源自于方正電子長期以來在出版領(lǐng)域的沉淀與積累。
“我們發(fā)現(xiàn)很多出版社面臨著工作強(qiáng)度大、重復(fù)勞動(dòng)多、出版周期長、成本上漲快等等現(xiàn)實(shí)問題。開發(fā)方正智能輔助編校排系統(tǒng)是希望能為出版機(jī)構(gòu)‘減負(fù)',用機(jī)器幫助‘人工作業(yè)',這套系統(tǒng)能為出版機(jī)構(gòu)提供圖書數(shù)字化生產(chǎn)平臺(tái),滿足作者、編輯、校對(duì)、排版等不同角色間跨地域、跨終端的生產(chǎn)作業(yè)需求?!睏钣抡f。
楊勇表示,從實(shí)際的應(yīng)用效果看,“智能編校排系統(tǒng)”不僅審校速度快,同時(shí)也很“專業(yè)”?!爸悄芫幮E畔到y(tǒng)”集成國家及行業(yè)標(biāo)準(zhǔn),辭海及專業(yè)術(shù)語,降低了專業(yè)圖書的審校門檻。以往需要老編輯或者外校才能看出來的錯(cuò)誤,年輕編輯通過審校工具也能輕易發(fā)現(xiàn),審校效率大幅提升。
除了“智能審?!?,這套系統(tǒng)還可以提供“智能比對(duì)”、“智能排版”服務(wù)。一本200頁的理工類圖書稿件,使用“智能排版”只要大約3分鐘就能完成,加上人工修圖,總共5個(gè)小時(shí)完成排版。而人工大概要16個(gè)小時(shí)。不僅如此,“智能排版”還能一鍵生成PDF、WORD、DOCBOOK、EPUB等多種格式,用實(shí)力幫助編輯“減負(fù)”。
解構(gòu)“智能審?!钡牡讓舆壿?/strong>
方正集團(tuán)數(shù)字出版技術(shù)國家重點(diǎn)實(shí)驗(yàn)室
高級(jí)算法研究員謝海華
領(lǐng)略了“智能編校排系統(tǒng)”的強(qiáng)大優(yōu)勢,在同期論壇上,方正集團(tuán)數(shù)字出版技術(shù)國家重點(diǎn)實(shí)驗(yàn)室高級(jí)算法研究員謝海華為大家深入解讀了“智能審校”背后采用的算法及技術(shù),同時(shí)也展現(xiàn)了這項(xiàng)技術(shù)的更多應(yīng)用前景。
謝海華表示,預(yù)訓(xùn)練語言模型、數(shù)據(jù)增強(qiáng)技術(shù)、句法分析、聯(lián)合學(xué)習(xí)、實(shí)體鏈接等自然語言處理領(lǐng)域的前沿技術(shù)和方法,應(yīng)用于解決易混淆詞誤用、搭配不當(dāng)、疊字疊詞、標(biāo)點(diǎn)符號(hào)誤用、引證錯(cuò)誤等問題的檢查和糾正當(dāng)中。
這項(xiàng)技術(shù)未來研究的方向還包括:語法錯(cuò)誤識(shí)別和糾正,專業(yè)及特定領(lǐng)域文獻(xiàn)的術(shù)語識(shí)別,針對(duì)命名實(shí)體的實(shí)體鏈接,以及基于知識(shí)庫、詞典的檢索?!跋嘈烹S著技術(shù)的不斷成熟,將來能為專業(yè)出版提供更專業(yè)的技術(shù)支持?!敝x海華說。
No.2 2019智慧教育發(fā)展國際論壇
2019智慧教育發(fā)展國際論壇主要面向高校、中小學(xué)教師等人群,圍繞教育數(shù)字出版轉(zhuǎn)型升級(jí)、融合發(fā)展等議題,探討教育出版服務(wù)教育現(xiàn)代化的新模式。
方正電子數(shù)字出版產(chǎn)品事業(yè)部產(chǎn)品總監(jiān)周坤向來賓們介紹了針對(duì)教育出版的解決方案——方正慧云教育融合出版方案。
看方正電子如何用技術(shù)助力教育出版
方正電子數(shù)字出版產(chǎn)品事業(yè)部產(chǎn)品總監(jiān)周坤
周坤表示,現(xiàn)如今隨著教育政策的變化、學(xué)習(xí)者的變化以及教學(xué)過程的變化,出版社的教材出版正面臨新的壓力和動(dòng)力,教材與課程融合的需求越來越突出。
方正慧云教育融合出版方案,包括教材出版與課程出版兩大版塊。其中,教材出版以紙質(zhì)教材為中心,融合互聯(lián)網(wǎng)技術(shù),建設(shè)能幫助學(xué)生自主學(xué)習(xí)的教材;課程出版以紙質(zhì)教材為主線串聯(lián)課程,建設(shè)課程體系,服務(wù)于教學(xué)過程。
方正慧云融合出版方案四個(gè)特色
目前,這套出版方案已經(jīng)在北京大學(xué)出版社、國家開放大學(xué)出版社、武漢理工大學(xué)出版社、大連海事大學(xué)出版社等多所高校出版社投入應(yīng)用,幫助出版機(jī)構(gòu)強(qiáng)化自身優(yōu)勢,打造融合出版。
No.3 第三屆期刊融合發(fā)展高峰論壇
于8月23日舉辦的第三屆期刊融合發(fā)展高峰論壇,旨在推動(dòng)期刊深度融合發(fā)展,提升期刊品牌意識(shí)及國際影響力、樹立行業(yè)融合創(chuàng)新典范、推廣融合發(fā)展經(jīng)驗(yàn)。
方正電子知識(shí)服務(wù)事業(yè)部產(chǎn)品運(yùn)營及推廣總監(jiān)趙婧在論壇上分享了XML數(shù)據(jù)在學(xué)術(shù)出版領(lǐng)域的應(yīng)用成果,同時(shí)系統(tǒng)分析了基于XML技術(shù)的全流程科技出版服務(wù)平臺(tái),在推動(dòng)學(xué)術(shù)行業(yè)生產(chǎn)力變革方面的廣闊前景。
XML數(shù)據(jù)在學(xué)術(shù)出版的應(yīng)用
方正電子知識(shí)服務(wù)事業(yè)部產(chǎn)品運(yùn)營及推廣總監(jiān)趙婧
“就當(dāng)前中國科技期刊的發(fā)展態(tài)勢,出版方式數(shù)字化、傳播效應(yīng)立體化、出版模式開放化是大勢所趨。但目前學(xué)術(shù)刊社的排版、內(nèi)容運(yùn)營流程,遠(yuǎn)遠(yuǎn)跟不上時(shí)代的發(fā)展步伐,變革已經(jīng)是勢在必行?!壁w婧說。
趙婧表示,基于對(duì)國內(nèi)期刊出版現(xiàn)狀的調(diào)研分析,方正電子推出了方正學(xué)術(shù)出版云服務(wù)平臺(tái)。以XML作為可跨平臺(tái)的數(shù)據(jù)存儲(chǔ)的方式,聚焦數(shù)字出版的核心,即數(shù)字內(nèi)容的存儲(chǔ)和發(fā)布方式,為出版單位打造出一個(gè)高效智能的數(shù)字化出版平臺(tái)。
目前,此平臺(tái)已經(jīng)能夠幫助刊社實(shí)現(xiàn)出版過程的數(shù)字化管控、單篇稿件即刻生產(chǎn)、多種格式成品文件同步生成,大幅提高工作效率。同時(shí),平臺(tái)可以利用XML數(shù)據(jù)組建刊社自主運(yùn)營的“資源中心”,實(shí)現(xiàn)學(xué)術(shù)資源二次出版,助力學(xué)術(shù)傳播,形成大數(shù)據(jù)報(bào)告,推動(dòng)期刊新媒體融合發(fā)展。
“從2018年6月,方正學(xué)術(shù)出版云服務(wù)平臺(tái)正式運(yùn)營至今,已有200多種期刊完成了生產(chǎn)方式的轉(zhuǎn)變,覆蓋了北京、上海、天津、江蘇等18個(gè)省份,涉及理學(xué)、農(nóng)學(xué)、工程技術(shù)、生物醫(yī)學(xué)等核心學(xué)科,并且?guī)?dòng)了傳統(tǒng)印刷企業(yè)的轉(zhuǎn)型升級(jí),支撐了為學(xué)術(shù)期刊提供專業(yè)服務(wù)的企業(yè)?!壁w婧說。
方正學(xué)術(shù)出版云服務(wù)平臺(tái)工作原理
“在未來,我們希望基于XML技術(shù)幫助刊社打造出一個(gè)全流程科技出版服務(wù)平臺(tái),連接作者、刊社及專家,解決從采編、生產(chǎn)、發(fā)布、傳播直至運(yùn)營的整條生態(tài)鏈。最終目的是以此為基礎(chǔ),實(shí)現(xiàn)行業(yè)各類相關(guān)知識(shí)發(fā)表、集成、存儲(chǔ)服務(wù)一體化平臺(tái),成為創(chuàng)新知識(shí)服務(wù)中心,用數(shù)據(jù)的力量推動(dòng)行業(yè)變革。”趙婧說。
XML技術(shù)應(yīng)用展望
就在這屆數(shù)博會(huì)上,中國新聞出版研究院發(fā)布了《2018—2019中國數(shù)字出版產(chǎn)業(yè)年度報(bào)告》,報(bào)告顯示出版單位轉(zhuǎn)型創(chuàng)新能力提升、業(yè)態(tài)復(fù)合化趨勢漸顯都是數(shù)字出版產(chǎn)業(yè)發(fā)展的趨勢。在出版業(yè)轉(zhuǎn)型融合持續(xù)深入發(fā)展的當(dāng)下,方正電子將繼續(xù)攜手傳媒出版同仁,助力出版業(yè)轉(zhuǎn)型融合不斷深化,邁向高質(zhì)量發(fā)展。