论学籍档案数据库系统的实现档案室

学生学籍档案是高校档案馆重要的馆藏资源，它记录着每位学生在校期间的学习生活,是学校对学生在校期间进行管理、考核时直接形成的具有保存价值的历史记录。学籍档案的利用率高，但是保管状况却不佳，存在着“保管”和“利用”的矛盾。笔者在2002年5月写了《试论学籍档案数据库的建立》，这篇文章已经系统阐述了学籍档案数据库的意义、建立学籍档案数据库的必要性、如何建立学籍档案数据库和在此过程中碰到的问题并给出了解决方案。

学籍档案数据库由原文数据库和学生信息数据库组成，原文数据库储存学籍档案原件的扫描文件，学生信息数据库存放所有学生的个人信息。建立学籍档案数据库就是构建原文数据库和学生信息数据库，并设计一个数据库管理系统将两者有效地联系起来，简单的说，这一学籍档案管理系统由执行程序、学籍档案原件的扫描文件集、学生信息数据库组成。执行程序将两者有效地联系起来，借助学生信息库，自由地调阅原文数据库中的扫描文件。

建立了学籍档案数据库就等于实现了学籍档案的数字化。如果说《学籍档案数据库的建立》是一个“初步设计方案”的话，那么《再论学籍档案数据库系统的实现》就好比是“竣工验收图”了。

以下，就系统的实现谈几个问题：

数据准备是系统实现的必要前提

在应用计算机管理档案的实践中体会到，在系统调试期，关键是制定学籍档案数字化方案；而真正地投入使用，则关键是档案数据的整理工作，向系统大量输入经过规范化处理的数据。大量的齐全的扫描件是学籍档案数据库系统实现的基础，从制定学籍档案数字化方案并付诸实施，已有将近二年了，大量的学籍档案原始件都已扫描存入计算机，数据准备工作已基本完成。

计算机的应用带动了档案管理的工作方法、工作流程和管理方法改变，数据准备应该成为档案馆的一项基本的、经常性的工作。认识了数据准备工作的重要性对我们开发任何档案数据库管理系统都有很大的帮助。

档案数据准备的整体规划，是要确定数据准备的数量、质量以及准备的方法。要在明确计算机辅助档案馆系统应用目标的前提下开展，以避免工作的盲目性，造成数据准备不充分、不完整、不规范。一个系统在它开发过程中如果明确数据准备的标准和规范、采集的原则、具体的工作安排，落实目标、落实人员，数据准备就会卓有成效，这对于系统开发工作效率的提高是十分明显的。

数据描述的复杂性导致了系统功能的不确定性，

学籍档案形成时间跨度大，早到1930年复旦中学时期，晚至1958年的大跃进时期再到文革时期，从民国到社会主义新中国，各时期教育体制的不同，形成的学籍材料更是不同，例如照片、学籍卡、成绩表规格不一且为散页，为使程序顺利历读所有的扫描文件，并与学生信息作多媒体链结，扫描文件的命名对系统的实现尤为关键。

为了使所有的学籍档案的扫描件符合要求，在我们制定的《学籍档案数字化方案》中也包含了《学籍档案扫描细则》的内容，其中对扫描文件的命名作了具体的规定就是“学号＋英文字母”的形式，然而在制定方案时不可能全部涵盖数据描述的复杂性，所以在所有的数据准备都完成之后，针对实际情况对程序部分进行调整甚至重写成为必然，在此过程中程序设计人员还碰到了新的技术难题—怎样使程序能读遍所有的扫描文件（将在后文具体论述）？这样，虽然造成了重复劳动，但这也是在管理系统开发过程中一个常见的问题。

系统实现的几个重要步骤
1. 建立学生学籍信息库

学生学籍信息库即学生的个人信息库，一人一个学籍袋，一个学籍袋一条记录。建立学生学籍信息库是学籍档案实现自动化管理的前提，也便于学生个人信息的统计。

首先，用Excel建由三个输入字段组成的表格，分别是序号、题名、数量（指学籍材料的张数），按照院系组成若干*.xls文件，按照档案著录的要求，题名统一为“复旦大学××系×××（学号）学籍袋”，这一题名包含了学生所在院系、姓名、学号三项必要的著录信息，其中姓名和学号构成唯一的标识。根据《学籍档案扫描细则》对扫描文件命名的具体规定，扫描文件名由学号是由数字和英文字母组成的，易于识别，这样扫描文件名中的学号就成为计算机识别的基本依据，同时学号也可作为多媒体链结的唯一标识。对所有这些*.xls文件整理之后导入Access数据库，形成学生信息数据库。

2.扫描文件的规范化处理

扫描文件数量巨大，占用了较大的硬盘存贮空间。在扫描过程中，还需进行必要的图像处理，特别是照片，由于年代久远，破损和模糊是难免的，用PHOTOSHOP图像处理软件对其进行修复和弥补，使每一幅图片做到尽可能的完美。这样，所有的扫描文件就规格统一，数据的规范也得到了保证。

3.系统实现的软、硬件基础

我们采用VB设计语言，使用Access数据库，设计一个具有一定规模、功能完备的数据库应用系统。因此系统适用的软件环境是Windows98、Windows Me 、Windows2000 Professional、Windows XP等操作系统，安装Microsoft Access2000和Microsoft Visual Basic 6.0并向下兼容所有版本。

硬件环境需根据扫描文件的数量制定，以复旦大学学籍档案管理系统的开发为例，原始扫描件约有25G的数据量，另加10G的空余安装相应的操作系统和应用软件，一个40G的硬盘就足够了，再配备一台彩色打印机便于输出打印。

四、编程中碰到的具体问题和解决办法

前面已经谈到数据描述的复杂性，在制定方案时不可能全部涵盖，那么在扫描文件已经形成的情况下，怎样使程序能读遍所有的扫描文件从而使所有的学籍档案的扫描件与数据库中的学生个人信息建立链结？成为一个必须解决的技术难题，也就是说，让程序解决扫描文件命名的不规范的问题，这样不但杜绝了工作中的失误，而且也是建立超链结的基础。

因此，程序设计人员必须在原先设计的方案基础上，重写源程序，并解决好新的技术难题，使重复的操作让程序来解决。

程序历读扫描文件的方法是以学生学籍信息库的学号为标准，依据命名规则，对扫描文件名进行逻辑判断，进而分组，程序流程如下：

注：a指文件长度，即len(长度)。

五、意义

依托复旦大学档案馆丰富的学籍档案馆藏资源，依靠馆内工作人员的辛勤努力和技术攻关，复旦大学学籍档案数据库经历了从基础性的扫描工作到创造性的程序设计和系统测试的过程，这一数据库系统终于实现并将投入运行。建立学籍档案数据库不但是建设数字化档案馆的一种探索，而且更为我们规划了数字化档案馆的美好前景。如何在新形势下用计算机辅助档案管理，更好地开发和利用档案信息资源，成为摆在我们档案工作者面前的一个不容忽视的问题。

数字化档案馆至少包含两层意思。一是基于计算机和高速信息网络技术，让数字化的档案资料纳入到新的信息服务机制中。终端程序可以调用学籍档案数据库，这种远程调用一般是在大型数据库Sybase, Oracle等中才能实现的，在本次学籍档案数据库系统的开发中，我们在这方面作了一些探索。二是从更深层次的意义上讲，档案馆的数字化可以更大限度地满足社会公众对档案信息利用的需求。随着全社会信息化的不断推进，校园管理信息系统的设计和应用也在校园各业务领域广泛开展，实现校园档案管理信息化的要求显得越来越迫切。档案管理模式也正在经历从传统管理模式到信息化管理模式的转变，可以说建立档案数据库是信息化管理的必由之路。网络化是一个系统工程，档案信息纳入信息化校园，进而纳入信息化高速公路，建立档案数据库是基础。建立了档案数据库，就可在广域网上提供高速横向跨库连接的电子存取服务了。

作者简介

姓名：严玲霞

工作单位：复旦大学档案馆

联系地址：邯郸路220号复旦大学档案馆

邮政编码：200433

联系电话：65642204

E-mail:fdaylx@fudan.edu.cn