当然Wordsmith是一个商业产品,不是设计用来跟你谈天说地聊妹子的。它可能大大解放体育,财经记者的双手—其实体育财经方面的报道通常的价值所在也就是比赛分数和股票指数,它的读者不太可能对此类报道的艺术价值抱有太大期望。所以,雅虎,美联社这些企业已经能够用Wordsmith完成大量的发稿任务了。
下面是Automated Insights网站上对Wordsmith的工作方式的一些介绍:
我们拥有专利的Wordsmith技术是一个自然语言生成(NLG)平台,帮助众多公司以前所未有的方式提升大数据的价值。下面是Wordsmith工作的流程:
1 获取数据
从客户(以API,XML,CSV,电子表格,等等形式),公用知识库和第三方数据提供者那里取得数据,我们几乎接受任何格式的数据。
2 分析数据集合
创建高级指标,来归类热点的趋势,记录,增量,和倾向等,并置入当时背景中。
3 确定出分析结果
Wordsmith在单独的数据中找出模式和趋势,把它们置入背景—针对目标人群并使其能够操作。
4 构建和格式
使用自然语言生成技术构造出一个故事并围绕着最重要的分析结果讲述故事情节。输出可以是任何格式:长篇小说,短幅公告,可视化内容,推特,新闻提要等。
5 发表
通过我们基于云的架构,我们可以通过API,JSON,XML,Twitter,邮件,网页和移动设备实时发表内容。我们甚至可以直接发表到你选择的CMS。
关于Wordsmith的自然语言生成(NLG)概念,自然语言生成是把结构化数据转化成人类语言的过程。Wordsmith,我们的自然语言生成平台,自动把这样:
或者这样:
的数据转化成这样的故事:
数据通常以图表,表格,曲线,和仪表图形式展现。下面为何自然语言生成是更好的选择的原因:
自然语言易于理解
曲线和图表是完全可视化的,通常需要专家的额外解释。自然语言则能够直接把专家级的分析表达出来。
自然语言能够澄清复杂的想法
曲线和图表在同一时刻只能展示有限的变量,但仅仅一个单词或短语就能提供丰富的信息。
例如,描述一次广告宣传效果为“平均值以上”需要用一系列指标以及公司和行业背景信息,可能需要好几张图表或仪表图来说明。
自然语言更有吸引力
自然语言生成平台保持了跟人类写作者同样的特点—通过不同的风格,语气,句子结构,和用词选择。仪表图和图表做不到这样—每次它们的结构是不变的。
自然语言是个性化的
基于个性化数据定制每篇报告。自然语言生成平台允许你创建数以百万计的文章,每篇都针对某个用户或一小组用户个性化,而不是试图仅仅去写一篇文章给上百万人看。
原创文章,作者:苏葳,如需转载,请注明出处:https://www.swmemo.com/1987.html
评论列表(5条)
不错的文章,内容横扫千军.禁止此消息:nolinkok@163.com
不错的文章,内容文笔极佳.禁止此消息:nolinkok@163.com
好文章,内容文笔极佳.禁止此消息:nolinkok@163.com
不错的文章,内容惟妙惟肖.禁止此消息:nolinkok@163.com
好文章,内容完美无缺.禁止此消息:nolinkok@163.com