ToP4CAS
协作创作系统的来源追踪器
“top4cas.jar”提取每个令牌在最新版本中的作者身份数据,用于修订的基于文本的内容。 “Test.java”是使用 Top4cas 的示例代码。
Top4cas 是一个系统,用于识别为每个版本管理的合着内容中每个词的来源。例如,通过提供维基百科文章每个版本的数据(将文本分成词的词和该版本的编辑者)作为输入,谁在文章最终版本的正文中撰写了每个描述以及何时。在单词级别输出。您还可以获取有关编辑者在哪个版本中添加了哪些词,以及哪些词是由谁编写并删除、保留或恢复的数据。具体执行示例程序Test.java。
2021-07-06 17:07:01
37KB
Java
1