百期小结- -| 回首页 | 2005年索引 | - -图书馆网页的“一窗式检索”

关于RSS应用的断想- -

                                      

基于RSS的应用(包括Folksonomy)近来被炒得火热,惊呼RSS时代到来者有之,认为其难以规范,不堪大用者有之,相关文章很快就汗牛充栋。对此本人还没有系统的研究,仅仅感到这种草根技术如同当初的Web一样,虽然简单,然而一定会大规模使用(已经如此了),并与众多的其他技术相结合,开发出眼花缭乱的应用。“基于社会书签的数字图书馆服务”即是一篇心得。以下罗列一些“断想”,在此志以备忘,以便进一步研究,同时提供大家共享。(如果哪位能受此启发发表文章,也请像“小农”朋友一样,在此告知一下,好让我也高兴高兴,呵呵)

Tag literacy中罗列的好的标签应该如下:

Keso游园的博客上参与了一次有关tagfolksonomy讨论把我的发言汇总如下

1tag或任何人类赋予信息资源的notation都可以看成分类法,是一种整体概括;

2、关键词或任何以语词代表概念表达信息资源的都可以看成主题法,是一种局部关照;

3、两者都可以来自于信息资源内容本身,也都可以不来自信息资源、作为人或机器自动附加于其上;

4、两者都是对信息资源的指代,并无本质区别。当tag表示为有意义的语词的时候,更消除了他们之间的差别;

5tag和关键词都可以相互关联,成为概念体系、语义网;不同层面的概念关联形成为不同的“面”,俗称“角度”,反映信息资源的不同方面,表达不同人的不同认识。

6、在相当长的时间里,计算机专家相信“机器”能够达到人工的准确性,同时提供人工无法达到的速度和效率;

7、最大的困难是没有足够规模的、可供计算机模拟人工的“语料”和“testbed”,好了,现在有了;

8、现在的问题变成如何使机器对付如此程度的“复杂性”,计算机必须把所有的现象、问题用抽象化、形式化、模型化的数据表示,才能交给计算机处理。除非你满足现状,不需要计算机处理。否则:GIGO

9、不考虑机器处理而进行规范化和形式化,任何“人文”地对tag的讨论都是毫无意义的。你可以说一千个一万个tag与关键词的区别,有什么用呢?

10、最本质的问题还在于:“谁”希望用tag干“什么”?

  • 我同意机器人不能高大全的说法。Easy Librarian在今天的网志中还在探讨http+html+url=web简单就是美的道理。Semantic Web从技术上说只是万维网向语义迈出的一小步,然而却已经显得太复杂,以至于到今天为止还只是小打小闹小trick,没有开发出什么killer techTag的应用可以不严格地算一个SW,然而当tag无限膨胀而没有规范和约束的时候,从总体上看它又趋向“热寂平衡”,最终达到熵为零的没有结构和信息的状态了。

  • "塌缩"的提法很有启发,在我的专业(图书馆学)中常常认为“塌缩”必须经过人工干预才能达到,或者叫做“机助人工”,“规范控制”,否则“塌缩”不可能是单调有界的。目前对于JiangWei等开发的新技术来说,需要做到的,我认为并不是发掘出什么玄妙的算法,为人之所不能为,超越google,人工智能多年的发展似乎证明了这是不可能的,而是利用这些大范围内人工添加的tags,作一些关乎“整序”的事情。不知JiangWei纯粹从语言学的角度效果是否好,我的感觉是从领域应用开始作,例如生物医药、教育课件等,效果应该不错。当然这可能商业价值不大。

  • 我再三强调,不要把人工和机器自动处理对立,不要认为草根民主一切都好,也不要对机器自动处理寄希望太高,两者如何结合,才是问题根本。当然我并没有看到应该如何结合,呵呵。


“谁”希望用tag“干什么”是把两个问句并成了一个,是说要切实了解用户是谁,以及用户用tag干什么。tag背靠背的两个方面:技术与人文,前者是工具,后者为人民服务才是终极目的,这一点上我们应该是一致的。

- 作者: kevenlw 2005年05月5日, 星期四 23:47 加入博采

Trackback

你可以使用这个链接引用该篇文章 http://publishblog.blogchina.com/blog/tb.b?diaryID=1424536

回复

- 评论人:只说

Sun May 29 10:00:33 CST 2005  作者Blog

Ping Back来自:blog主题讨论与卡农换位 http://www.donews.net/sayonly/archive/2005/05/29/403414.aspx

- 评论人:三木

Mon May 16 08:50:11 CST 2005  作者Blog

应该考虑冗余性,互联网最终进化成“全球脑”,大脑的冗余性是很高的。

- 评论人:jiangwei

Sun May 08 02:39:36 CST 2005  作者Blog

很高兴老兄再次在这篇文章中提到我,我想,自己纵然算不上是国内第一个开发有关人机互动式tag提取的人,也算得上是第一批开发这类技术的人了,请keven尽快与我联系,我把我们做好的程序提供给你给你看看,看是否对tag的研究有贡献。jiangwei@bjfao.gov.cn

- 评论人:只说

Sat May 07 18:50:12 CST 2005  作者Blog

Ping Back来自:RSS摘要 http://www.donews.net/sayonly/archive/2005/05/03/361752.aspx

- 评论人:echo

Sat May 07 13:49:46 CST 2005  作者Blog

把“谁”希望用tag“干什么”这个问句变形为“谁”想“动词”tag.

用典型句型体系作为一种tag的行为控制来联结TAG的“面”,这本身就是TAG(社会书签)作为语义网(基模网络)的特例:联结主义的体现本体。而众观现在的互联网,43things无疑就是这种理论的最好应用成果!

“社会书签的广泛应用可以算语义万维网的一个特例,就像XML是SGML的特例一样,其声名显赫极有可能盖过语义万维网。当初WWW不就很快盖过了Gopher”

这跟认知科学中的理论演化:80年代初期基模理论取代逻辑理论,90年代中叶联结理论取代基模理论。何其的相似。仅不过理论化为实际应用都整整需要十年!

【蝉】什么是“联结主义”
http://www.blogcn.com/user15/echo_soco119/blog/5290381.html

评论内容: