狠狠撸

狠狠撸Share a Scribd company logo
主题:微格式(惭颈肠谤辞蹿辞谤尘补迟)分享人:马泽声        时间:2010-12-29      摘要:建立在已有的、被广泛采用的标准基础之上的一组简单的、开放的数       据格式;是兼顾人机可读性设计的数据表达方式,对Web网页进行语义注解的方法……涉及知识点:介绍微格式的概念,微格式技术体系的概念和意义,归纳并详细论述     由数据结构化定义和标记的微格式、个人及组织信息标记的微格式等  相关资料:http://zh.wikipedia.org/zh/微格式             http://microformats.org/
微格式的开放性定义(2005.6)
1.微格式的定义    建立在已有的、被广泛采用的标准基础之上的一组简单的、开放的数据格式;是把语义嵌入到HTML以便有助于分离式开发而制定的一些简单约定,是兼顾人机可读性设计的数据表达方式,对Web网页进行语义注解的方法,这种方法依托于标准的Web页面写作技术。------microformats.org    是通过语意相关让内容人机可读;从技术上来说,这些数据是一些语义标记,用标准的(X)HTML中的class名称设置;它是开放、可用、自由的,可以被任何人使用。------维基百科    一组结构化数据的开放标准;是包含数据的结构化的XHTML代码块的定义格式,由于是XHTML代码块,所以很适合人类阅读,由于是结构化的,又很容易被机器处理,很容易和外部进行数据通信。------百度百科
2.微格式体系所谓微格式技术体系是指由各种微格式组成一系列信息组织和处理技术的总称。组成部分建立基础基本微格式复合微格式微格式齿惭尝齿贬罢惭尝
2.微格式体系2.1 基本微格式基本微格式是解决单一问题的最小解决方案,采用了XHTML支持的rel、rev、class等属性定义了具有语义的属性集,嵌入到网页文件中直接使用,或者作为复合微格式的基本组成要素。    这类的微格式有XOXO、XMDP、rel-license、 rel-nofollow、rel-tag、XFN等2.2 复合微格式    复合微格式由基本微格式和标准的XHTML元素组成的,解决描述复合数据类型现存标准方案与XHTML之间准确转换问题。这类的微格式有hCalendar、hCard、hRewiew等
2.微格式体系2.3 目前已具备完整规范的微格式还包括:hCard、hCalendar、XOXO、XFN、VoteLinks和 3个“rel-”微格式:rel- 濒颈肠别苍蝉别、谤别濒-苍辞蹿辞濒濒辞飞、谤别濒-迟补驳其他微格式还包括丑础迟辞尘、骋别辞等。
3.微格式在实际应用中的意义和作用?微格式按照某种已有的被广泛应用的标准,通过对内容块的语义标记,可以让外部应用程序、聚合程序和搜索引擎能够做以下事情:在爬取Web内容时,能够更为准确地识别内容块的语义; 对内容进行操作,包括提供访问、校对,还可以将其转化成其他的相关格式,提供给外部程序和Web服务使用。
4.微格式应用4.1 作为数据结构化标记和定义的微格式( XMDP  、 XOXO )    XMDP(XHTML Meta Data Profiles)用于定义HTML的元数据配置文件;微格式利用XMDP包含的格式定义相关的属性、属性定义、简短描述等信息,以<div class="profile">为格式定义头,对其他微格式的结构进行定义和标记。  XOXO是拓展型开放XHTML规范(eXtensible Open XHTML Outlines)的简称。XOXO定义了一种新的XHTML文档类型,以模块化XHTML的形式定义模块框架和各种模块。采用XHTML结构定义标签元素“body”、“head”、“html”,列表标签“dl”、“dt”、“li”等以及标签元素属性text、description、url等定义了微格式赖以存在的结构,是基本的用于定义其他微格式及正确显示微格式的基础,是实现数据结构化、语义化的基础,其具体的发布则可以采用XHTML,也可以采用纯XML文件。
4.微格式应用4.2 标记描述个人和组织信息的微格式(hCard、hCalendar、 XFN 、hResume)        微格式hCard是建立vCard标准的基础上,以XHTML具有语意化的标签属性来表征个人和组织机构的联系信息,从而将非结构化的数据转变成了结构化的数据,便于第三方软件的自动抽取。        hCanlendar则是为了将互联网上发布的诸如“会议日程安排”、“课程安排”等与个人日程安排密切相关的非结构化信息转化成结构化信息的微格式。它建立在诸如vCanlendar和iCanlendar这样的国际日历和日程安排标准的基础上,提供对“组织者”、“时间”、“地点”等项目标记和描述,便于将这些信息导出到用户个人日程安排管理软件中。
4.微格式应用4.2 标记描述个人和组织信息的微格式(hCard、hCalendar、 XFN 、hResume)XFN(XHTML Friends Network),是全球多媒体协议组为了在互联网上显化人类之间的关系,通过赋予超链接语义属性表征人类关系的简单方式。它以枚举的方式定义了“Friendship(朋友)”、“Professional(工作关系)”、“Geographic(地缘关系)”、“Family(家庭关系)”、“Identify(其他所有的关系)”等7种关系及其具体关系值和约束条件。        hResume是一种复合微格式,它使用纯文本的“text”描述一般性的描述,使用hCard描述个人联系信息和相关的机构信息,使用hCalendar描述工作经验和教育背景,使用rel-tag描述个人技能,使用cite tag描述发表的作品等,专门用于发布个人简历和个人履历表信息的微格式,适合于嵌入到(X)HTML、Atom、RSS和专门的XML文件格式中。
4.微格式应用4.3 超链接标记和描述的微格式        微格式技术体系中的超链接标记和描述微格式就是使用XHTML为这些超链接增加语义化标签,从而实现结构化的目的。具备完整规范的:rel-nofollow 、rel-license 、rel-tag其他草案中:rel-directory 、rel-home 、rel-enclosure
4.微格式应用4.4 评论机制标记和描述的微格式(hReview、VoteLinks)hReview,作为一种分布存在评论的发布标准,通过为评论内容增加语义化标签,使得评论内容数据得以结构化,以便于评论内容的发布、共享、聚合和集成。hReview是一种复合标准,充分利用hCard和HCalendar标准已经定义的元素,这些元素包括:版本、概要、项目类型(产物、商业服务、事件等)、项目信息(利用hCard标识个人和商业联系信息,利用hCalendar标识事件)、评论者、评论时间(dtreviewed)、评分等级(rating)、具体的描述、tags、永久性地址(permalink)和许可证(license)等。        痴辞迟别尝颈苍办是一种基本微格式,其使用的元素比较少,要解决的问题也比较简单;用户只需要表示其最简单的意见,同意、不同意、中立或弃权。
4.微格式应用4.5 其他应用标记和描述的微格式用于书签发布hFolk用于地理位置经度纬度等信息标注的geo应用于电子商务的rel-payment……
5.微格式的特点1.语义化的贬罢惭尝和颁厂厂类名称来标记共同内容。2.使机器可以阅读和理解可能只有人类可理解的数据,一系列的标准化方法。3.微格式允许网站上的内容轻易地与其他应用对接,从而提高信息的使用率。4.为特殊应用而制定的特殊格式;5.可以插入到网页或齿惭尝元数据中,被收割和索引,数据可被重用,也可自定义,完全取决于应用;
结束语    人们一直在尝试从非结构化的 Web 中提取结构化数据; 微格式是向着导出 Web 上的结构化数据这一方向迈进的

More Related Content

Microformat