AI正在重塑软件行业的交互模式,给办公带来更高效和轻松的创作体验。在近期举办的全球机器学习技术大会上,金山办公算法总监刘长波就WPS AI的技术探索与办公自动化实践这一话题,分享WPS AI的最新成果以及背后的技术逻辑。
刘长波介绍,从开创计算机“中文字处理时代”到当前进化到AI办公时代,金山办公始终坚持技术立业,通过对文档技术、AI技术的持续积累,2024年在大模型AI应用方面实现了全新突破,为用户探索全新的人机交互创作模式。
AI伴写,帮你表达卡在嘴边的句子
2023年11月,金山办公旗下具备大语言模型能力的智能办公助手WPS AI开启公测。2024年7月,WPS AI全新升级为2.0版本,包含为个人用户新增的AI写作助手、AI阅读助手、AI数据助手、AI设计助手,以及 WPS AI企业版、WPS AI 政务版。
WPS AI写作助手里有一项基于AI Agent(人工智能体)范式驱动的伴写功能,为用户带来更可控、更易上手、更专业的AI创作体验。
无论是写汇报材料、项目方案还是写考核评语、发言稿件,WPS AI伴写都可以为用户提供沉浸式体验,根据用户输入的内容提供智能建议并接续写作,辅助用户表达出“卡在嘴边的句子”。
刘长波介绍,Al伴写和市面上其他同类产品相比,最大的不同是无需用户撰写提示词,AI先理解用户前文的意图、行文逻辑,再推测用户的写作意图,根据上文的情景提供准确的措辞,最后进入到生成的阶段,实时地提供后文续写建议。
AI伴写还可以参考用户添加的本地文档、云文档和网页等资料,引入古文诗句、法律法规、常用模板等“金句库”的内容,进一步减少模型幻觉,确保文档的可信度和专业性。当然,好的RAG结果离不开Chunking、Prompt等工程的调优。如数据分块方面,统计数据用段落分块,表格数据合并分块,问答数据用大语言模型分块,WPS AI采用不同的优化方式。
AI风格克隆,好看的PPT模板一键套用
PPT的撰写与排版是另一个无数打工人容易遇到的痛点,撰写脑图大纲、美化排版、制作图表、寻找配图、调整尺寸等无不考验打工人的耐心和经验。刘长波还分享WPS AI在PPT撰写、PPT美化等方面的最新成果和技术逻辑。
只需向AI简单描述需求,AI就能快捷输出一个图文并茂的PPT。或者上传现成的文档、脑图大纲,AI能够直接转为结构清晰的PPT。依托WPS的文档解析能力,WPS AI还可以将稻壳的数亿级模板适配到用户的PPT,帮助用户完成PPT美化。如果有想要借鉴的PPT模板,用户用WPS AI的风格克隆功能,就能实现PPT风格的一键智能复制及套用。
刘长波介绍,PPT智能美化涉及全文换肤、智能配色、统一版式、统一字体等工作任务,WPS有数以亿计的模板库资源,AI的挑战是建立用户文档与模板、配色方案之间的对应关系。在理解用户文档上,AI需要识别页面类型、对象类型、对象关系,为此,WPS AI综合利用OCR、NLP & CV、ML+DL分类模型、多模态大模型等技术打造涉及上百个规则的识别模型,完成用户文档的拆分与结构化识别。
在用户文档的模板匹配上,WPS AI的模板推荐模型需要解决选择哪些模板、匹配哪些部件、计算部件匹配度、模板匹配度评分、美化特性处理等一系列挑战。其中,WPS AI对模板匹配度评分的要求,保证了算法推荐的PPT模板资源在套用用户内容后可以无限接近模板的美化效果。
刘长波表示,金山办公将继续深耕AI技术领域,持续重构办公软件的交互模式。通过不断探索和创新,为用户提供更加优质、高效的一站式AI办公体验。
AI阅读助手调优了问答模型,升级对文档的解析、总结、问答效果,例如让AI阅读一篇PDF格式的学术文章,可在窗口中给出关键词、摘要和正文内容的总结,以及研究结论、研究方法等。
AI数据助手可在表格中完成海量数据的AI计算、分析和归类,用户以自然语言提出需求,AI可转换写出相应代码,并在表格中执行。