摘 要
Flash 动画以其格式小、交互性好、制作简单等优点成为网络中最受欢迎的媒体形式,它集成了文本、图形、图像、声音、视频、动画等多种媒体形式,符合一个多媒体课件的根本要求,因此,受到广大课件制作者的喜爱。面对网络中日益增多的 Flash 动画,在网络中搜索 Flash 动画、管理 Flash 动画成为一个重要的问题。目前,网络中 Flash 检索工具主要是基于上下文的检索或者是基于 Flash动画中文本关键词的检索,检索效率不高,不能根据用户需求制定个性化检索。
因此,需要建立一种基于 Flash 动画内容和高级特征的检索系统。本文从 Flash动画的文本及其属性出发,探讨基于内容的 Flash 动画检索,提取 Flash 动画的文本特征信息,是 Flash 动画内容管理和搜索引擎研究与开发工作的一部分。
本文以 SWF 格式文件为基础,结合 XML 文件格式特点,实现了 SWF 文件向 XML 文件的转换,并在此基础上提取了 SWF 动画文本及其属性特征,建立了 Flash 动画描述模型,进一步研究了 Flash 动画检索系统,主要包括以下几个方面:
1.通过分析 SWF 格式文件,根据 Flash 动画特有的文件结构和数据类型,探讨了 Flash 动画的形成机制和运行原理,为 Flash 动画组成元素提取奠定了重要的理论基础。
2.通过对 SWF 文件转化成 XML 文件的可行性分析,利用计算机语言编写了 SWF 和 XML 文件转换程序,实现了 SWF 动画二进制文件向 XML 描述性文件的转换,从而可以直接从 XML 文件中读取相关对象信息,为提取其它对象信息作准备。
3.在 SWF 格式转换成 XML 格式的基础上,主要分析了 SWF 文件中文本对象的存储方式,提取了 Flash 动画中的文本块对象,并提取了文本块的字号、字体、颜色、位置、所在帧号等属性特征,进一步判断了文本块的功能,为下一步基于关键词的检索提供了基础。
4.在提取 Flash 动画文本的基础上,通过对所提取的文本进行中文分词、过滤、去重、词频统计等操作,提取了 Flash 动画内部中能够描述动画重要内容的关键词,从而为基于内容的 Flash 动画检索提供支持。
5.提出了一种基于框架的 Flash 动画描述模型,将 Flash 动画分成四个层次,自上而下依次是:Flash 动画总体内容特征、逻辑场景、视觉场景、组成元素,并对这四个层次的内容及它们之间的关系进行分析。
6.简要的描述了 Flash 动画检索系统,将检索系统分成三个部分:表示层、索引层和检索层,通过这三个部分的研究,实现了 Flash 动画的管理和检索。
本文立题研究与开发基于内容的 Flash 动画分析平台,建设 Flash 动画内容特征索引库,实现了基于内容和高级特征的 Flash 动画检索,从而对合理有效的组织多媒体教育信息资源,提高人们检索多媒体资源,尤其是检索 Flash 动画课件资源的效率具有实际意义。
【关键词】SWF 文件格式;多媒体检索;文本提取;格式转换;描述模型
ABSTRACT
Flash animation is the most popular multimedia on the net, because of its small format, interactivity, friendliness and simpleness, it integrates texts, graphics, images,sounds, videos, animations and other medias, which complies with the fundamental requirements of a multimedia courseware, therefore, many courseware producers like it very much. With the development of Flash Web animation, the search and management of Flash animation have become an important issue. At present, the research of retrieval and management of Flash animation is based on context or the key words in the Flash animation, in this way, the retrieval efficiency is unsatisfactory and the users can not develop personalized Flash retrieval according to their needs. So we need to establish a Flash animation retrieval system based on content and advanced features. In this paper, we base on the texts in Flash animation, and discuss the Flash animation based on Flash content, then extract the feature information in Flash animation, which is part of the retrieval and management Flash animation.
This paper bases on the SWF file format, combining the XML file format to achieve the SWF file to XML file conversion, and on this basis, it extracts the texts and its properties in SWF file, then Flash animation description model is established to further study of the Flash animation retrieval system. This paper mainly includes the following aspects:
1. By analyzing the SWF file format, we explore the formation mechanism of the Flash animation according to the structure and data types in SWF file, and then laid an important theoretical basis for the extraction of elements in Flash animation.
2. By analyzing the feasibility of SWF file to XML file, we use computer languages to achieve this program, which achieved the conversion of SWF animation binary documents to XML description file, which can be read directly from the XML file related objects information.
3. Based on the conversion of SWF format into XML format, we mainly analyze the texts which stored in SWF file, estract the text block in SWF file and size of text, color of text and so on.
4. Based on the extraction texts in Flash animation, we can deal with those words, such as take the texts into words, filter, remove duplicate and frequency statistics of words, then get the key words from Flash animation.
5. A generic framework is proposed that facilitates users to access Flash movies by semantic content. This framework has a 4-tier architecture constituted by Flash animation features of the overall content, logic scene segmentation, visual scene segmentation and constituent elements from bottom to top.
6. A brief description of the Flash animation retrieval system is made, and the retrieval system will be divided into three parts: representationlayer, indexing layer and retrieval layer. Through this three-part, we have achieved the management and retrieval of Flash animation.
The research topic is to develop content-based Flash animation analysis platform, and build Flash animation content features indexed databases, achieve the Flash animation retrieval based on content and advanced feature, which is effective for organization of multimedia educational information resources. The retrieval system will improve the retrieval of multimedia, especially for the retrieval of Flash animation.
【keyword】SWF file format; multimedia retrieval; text extraction; format conversion;description model
随着计算机技术的飞速发展,计算机在教育中的作用也越来越明显,计算机在教育中的应用主要有两种方式:计算机辅助教学(CAI)与计算机管理教学(CMI)[1]。计算机管理教学是利用计算机系统帮助教师管理和指导教学过程的一种信息处理系统,它能完成监督与管理有关教学活动、编制试题和进行评分、收集和分析学生的学习情况等功能。
计算机辅助教学是利用计算机作为主要的教学媒体来进行教学活动,即利用计算机来辅助教师执行教学任务,传递教学信息。随着多媒体技术、网络通信技术的发展,多媒体教学已经成为计算机辅助教学的核心,多媒体教学是指利用多媒体计算机,综合处理和控制符号、语言、文字、声音、图形、图像、影像等多种媒体信息,把多媒体的各个要素按教学要求进行有机组合并通过屏幕或投影机投影显示出来,同时按需要加上声音的配合,以及使用者与计算机之间的人机交互操作,完成教学或训练的教学过程。多媒体教学主要包括多媒体教学硬件和多媒体教学软件组成。多媒体教学硬件主要包括多媒体计算机、投影仪、网络设备等。多媒体教学软件是多媒体教学的主要方面,它是一种根据教学目标设计的,表现特定的教学内容,反映一定教学策略的计算机教学程序,它可以用来储存、传递和处理教学信息,能让学生进行交互操作,并对学生的学习作出评价的教学媒体,通常称为课件。
多媒体课件可以通过多媒体制作软件来实现,目前比较流行的多媒体制作软件主要包括 Authorware、PowerPoint、Flash 等,其中 Flash 动画以其格式小、交互性好,制作简单,扩展性好等优点得到广大课件制作群体的喜爱。Flash 是一种矢量图形动画,特别适用于创建通过 Internet 提供的内容,矢量是以数学公式而不是大型数据集来表示的,所以矢量图形需要的内存和存储空间很小。正因为 Flash 动画具备了课件应有的特性,加上它体积小、制作简单等优点,使它具有了很强的生命力,在网络课件的发展中不至于被淘汰,反而占据了主导地位。
根据 Adobe 公司 2009 年 12 月份的调查显示,Adobe Flash 播放器是世界上最广泛的软件平台,大约有两百万专业人士使用,99%的上网计算机上都装有 Flash播放器或者播放器插件[2]。面对日益增多的 Flash 动画,在网络中搜索 Flash 动画、管理 Flash 动画成为重要的一个问题。目前,Google 已经提供了专门检索 Flash 动画的功能,并且能根据 Flash 动画内部文本关键词进行检索,其检索的效率和质量都达到了良好的效果。但是网络上还没有针对 Flash 动画高级语义特征的检索和管理工具,不能根据用户的个性化选择进行检索,对 Flash 动画检索、分类、描述的软件和网站也都很少,急需建设一个 Flash 动画管理平台。
本文通过对 Flash 动画内容的分析和提取,结合现有的 Flash 动画内容分析研究成果,旨在建立一个基于内容的 Flash 动画检索和管理平台,从而对合理有效的组织多媒体教育信息资源,提高人们检索多媒体资源,尤其是检索 Flash 动画课件资源的效率具有实际意义。
Flash 是一种创作工具,设计人员和开发人员可使用它来创建演示文稿、应用程序和其它允许用户交互的内容[3]。Flash 可以包含简单的动画、视频内容、复杂演示文稿和应用程序以及介于它们之间的任何内容。通常,使用 Flash 创作的各个内容单元称为应用程序,即使它们可能只是很简单的动画,也可以通过添加图片、声音、视频和特殊效果,构建包含丰富媒体的 Flash 应用程序。
Flash 动画文件即 SWF 文件是一种开源的文件格式,它定义了 Flash 动画的存储和播放规则,是解析 Flash 动画文件的重要参考。从 SWF 版本 3 到 SWF 版本 8 都是 Macromedia 公司发布,2007 年 Adobe 公司收购 Macromedia 公司之后发布了 SWF 版本 9 和 SWF 版本 10,这些开源版本说明书都能从 Adobe 公司网站上进行下载。
目前,Google 已经建立了基于文本内容的 Flash 动画检索系统,根据用户提供的关键词,它能精确的寻找包含该关键词的Flash动画,并直接提供给用户SWF格式的动画文件[4]。在国内的动画检索系统中,主要是通过 Flash 动画所在网页中的文本进行检索的,例如百度在接受用户提供的关键词之后,它不是根据 Flash动画内部的文本进行匹配,而是根据包含该动画的网站中的文本进行匹配,所以准确率上会有所偏差,并且不能满足用户制定个性化的检索,如基于逻辑场景、视觉场景的检索。
网络中的一些开源软件对 Flash 动画进行了一定程度的分析。JavaSWF 对SWF 格式提供了一个纯 Java 的类库,通过这个类库可以对一个 SWF 文件进行读写操作,可以完成 SWF 格式到 XML 格式文件的转换,并且这个类库可以在其它程序中调用[5]。虽然 JavaSWF 完成了对 SWF 文件的解析,但是 JavaSWF 在最近几年中没有更新,不能完成对 SWF 新版本的解析,对旧版本中存在的一些漏洞,JavaSWF 也没有给出很好的解决方案。Macromedia Generator 是一个自动更新 Flash 网站数据驱动的软件,它能进行一些简单的对象操作,例如文本替换、绘制形状等,它可以在原有 Flash 动画的基础上导入文本文件、矢量图形文件、图像文件等来更新动画内容,但是 Macromedia Generator 是一个很昂贵的收费软件,不能被广泛的使用。Ming 是一个用 PHP 语言编写的程序,它可以通过 PHP语言来创建 Flash 动画文件,但是创建的动画文件只能包含文本和实心填充的形状,Ming 也是一个开源的软件。Swish 是一个快速、简单制作 Flash 动画效果的软件,它能快速简单地在网页中加入 Flash 动画效果,可选择的预设效果超过 150种,包括创造形状、文字、按钮以及移动路径,但是 Swish 也是一个收费软件,不能被广泛的使用[6]。此外还有许多 Flash 动画分析软件,但是它们在功能上有很大的相似性,本文不再进行描述。
国外有关 Flash 动画的研究虽然很多,但是纵观这些软件和开源程序,它们在很大程度上有着重复的功能,并且它们只是完成了分析 SWF 文件的工作,没有从宏观上提出一个 Flash 动画管理方案,并且由于资金方面的问题,大多数开源软件只完成了部分工作,没有深入的实现软件的功能,由于 SWF 格式说明书存在错误的原因,使得这些软件在一些地方也存在着漏洞。
Flash动画的内容提取方法演示:
Flash 动画文本分析程序截图
Flash 动画文本入库程序截图
目 录
摘 要
ABSTRACT
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 Flash 动画内容提取研究现状
1.2.2 Flash 动画特征描述研究现状
1.3 论文的研究方法和组织结构
1.3.1 论文的研究方法
1.3.2 论文的组织结构
第二章 SWF 动画文件格式概述
2.1 SWF 文件中的基本数据类型
2.1.1 整数类型
2.1.2 定点和浮点数据类型
2.1.3 位值和 RECT 结构体
2.1.4 字符串数据类型
2.1.5 颜色记录
2.1.6 矩阵记录
2.1.7 其他数据结构
2.2 SWF 文件存储结构分析
2.2.1 SWF 的文件头
2.2.2 SWF 标签说明
2.2.3 定义标签和控制标签
2.2.4 播放列表
2.2.5 SWF 文件的压缩
2.3 本章小结
第三章 FLASH 动画的格式转换与内容提取
3.1 FLASH动画中的组成元素
3.2 FLASH动画特征提取的层次
3.3 FLASH动画与 XML 文件的转化
3.3.1 XML 格式简介
3.3.2 Flash 动画转换成 XML 格式的可行性
3.3.3 Flash 动画格式转换的实现
3.4 FLASH动画文本特征的提取和处理
3.4.1 Flash 动画中文本的存储方式
3.4.2 文本的提取
3.4.3 文本对象特征的提取
3.4.4 Flash 动画文本特征的处理
3.4.5 Flash 动画关键词的提取
3.4.6 文本特征的提取和处理工具简介
3.5 本章小结
第四章 FLASH 动画描述模型研究
4.1 FLASH动画结构与内容特征
4.1.1 逻辑场景
4.1.2 视觉场景
4.1.3 组成元素
4.2 基于框架的 FLASH动画的描述
4.3 FLASH动画检索系统
4.4 本章小结
第五章 总结与展望
5.1 工作总结
5.2 展望
注 释
参考文献
攻读硕士学位期间发表的学术论文
致谢
(如您需要查看本篇毕业设计全文,请您联系客服索取)