- 中文名
- 文件系统
- 外文名
- file system
- 类 别
- 操作系统
- 目 的
- 为了管理空间
在计算机中,文件系统(file system)是命名文件及放置文件的逻辑存储和恢复的系统。DOS、Windows、OS/2、Macintosh和UNIX-based操作系统都有文件系统,在此系统中文件被放置在分等级的(树状)结构中的某一处。文件被放置进目录(Windows中的文件夹)或子目录,在树状结构中你希望的位置中。
文件的系统是操作系统用于明确磁盘或分区上的文件的方法和数据结构;即在磁盘上组织文件的方法。也指用于存储文件的磁盘或分区,或文件系统种类。因此,可以说"我有2个文件系统"意思是他有2个分区,一个存文件,或他用 "扩展文件系统",意思是文件系统的种类。
磁盘或分区和它所包括的文件系统的不同是很重要的。少数程序(包括最有理由的产生文件系统的程序)直接对磁盘或分区的原始扇区进行操作;这可能破坏一个存在的文件系统。大部分程序基于文件系统进行操作,在不同种文件系统上不能工作。
一个分区或磁盘在作为文件系统使用前,需要初始化,并将记录数据结构写到磁盘上。这个过程就叫建立文件系统。
大部分UNIX文件系统种类具有类似的通用结构,即使细节有些变化。其中心概念是超级块superblock,i节点inode,数据块data block,目录块directory block,和间接块indirection block。超级块包括文件系统的总体信息,比如大小(其准确信息依赖文件系统)。i节点包括除了名字外的一个文件的所有信息,名字与i节点数目一起存在目录中,目录条目包括文件名和文件的i节点数目。i节点包括几个数据块的数目,用于存储文件的数据。i节点中只有少量数据块数的空间,如果需要更多,会动态分配指向数据块的指针空间。这些动态分配的块是间接块;为了找到数据块,这名字指出它必须先找到间接块的号码。
UNIX文件系统通常允许在文件中产生孔,意思是文件系统假装文件中有一个特殊的位置只有0字节,但没有为这文件的这个位置保留实际的磁盘空间。这对小的 [2]二进制文件经常发生,Linux共享库、一些数据库和其他一些特殊情况。
文件系统的功能包括:管理和调度文件的存储空间,提供文件的逻辑结构、物理结构和存储方法;实现文件从标识到实际地址的映射,实现文件的控制操作和存取操作,实现文件信息的共享并提供可靠的文件保密和保护措施,提供文件的安全措施。
主要缺陷:数据关联差,数据不一致,冗余性。
下面是文件系统的代码,根据这个代码我们可以更好地了解文件系统的工作流程
- 1.main.cpp
#include"blockinodesuperblock.h"
//-----------------------
intmain()
{
control.open("control.txt",ios::in|ios::out|ios::nocreate);
inti;
control>>i;
control.close();
if(i!=0)//不为0就初始化
{
initial();
}
control.open("control.txt",ios::in|ios::out|ios::nocreate);
control.seekp(0);
control<<0;//默认是上次基础上继续下去不用再初始化
control.close();
strcpy(curname,"root");//当前目录文件名为root
road[0]=0;//当前目录路径(存放从根目录到这里的结点号)
num=1;//最后位road[num-1]为当前目录文件i结点号
cout<<"请登陆系统\n";
while(!login())//登陆为止
cout<<"wrong!!!\n";
cout<<"loginsuccess"<<endl;
cout<<"******Welcome"<<auser<<"******";
readsuper();
getcommand();//命令解析函数
writesuper();
return0;
}
blockinodesuperblock.h
intialloc()//申请一个i结点返回结点号否则返回-1
{
if(superblock.fiptr>0)
{
inttemp=superblock.fistack[80-superblock.fiptr];//当前可用
superblock.fistack[80-superblock.fiptr]=-1;
superblock.fiptr--;
returntemp;
}
return-1;
}
//----------------------
voidifree(intindex)//指定一个结点号,回收一个i结点
{
disk.open("disk.txt",ios::in|ios::out|ios::nocreate);//清空结点
disk.seekp(514+64*index+2*(index/8));
disk<<setw(64)<<'';
disk.close();
for(inti=80-superblock.fiptr;i<80;i++)//结点号找到合适位置插入空闲结点号栈
{
if(superblock.fistack<index)//小于它的前移一位
{
superblock.fistack[i-1]=superblock.fistack;
}
else//放在第一个大于它的结点号前面
{
superblock.fistack[i-1]=index;
break;
}
}
superblock.fiptr++;
}
//----------------------
/*成组链接法*/
intballoc()//申请一个盘块返回盘块号否则返回-1
{
inttemp=superblock.fbstack[10-superblock.fbptr];
if(superblock.fbptr==1)//是栈底了==>;是记录盘块了
{
//是最后记录盘块最后号0(保留作栈底分配不成功)
if(temp==0)
{
return-1;
}
suprblock.fbstack[10-superblock.fbptr]=-1;
superblock.fbptr=0;
//盘块内容读入栈
for(inti=0;i<10;i++)
{
intid,num=0;
disk.open("disk.txt",ios::in|ios::out|ios::nocreate);
//先计算盘块内容个数num(最多10),最后盘块可能不到10个
disk.seekg(514*temp);
for(inti=0;i<10;i++)
{
disk>>id;
num++;
if(id==0)break;
}
disk.seekg(514*temp);//盘块内容读入栈
for(intj=10-num;j<10;j++)
{
disk>>id;
superblock.fbstack[j]=id;
}
superblock.fbptr=num;
disk.close();
}
disk.open("disk.txt",ios::in|ios::out|ios::nocreate);//清空回收盘块
disk.seekp(514*temp);
disk<<setw(512)<<'';
disk.close();
//盘块使用掉
returntemp;
}
else//不是记录盘块==>;盘块使用掉
{
superblock.fbstack[10-superblock.fbptr]=-1;
superblock.fbptr--;
returntemp;
}
}
//----------------------
在Win 9X下,FAT16支持的分区最大为2GB。我们知道计算机将信息保存在硬盘上称为“簇”的区域内。使用的簇越小,保存信息的效率就越高。在FAT16的情况下,分区越大簇就相应的要大,存储效率就越低,势必造成存储空间的浪费。并且随着计算机硬件和应用的不断提高,FAT16文件系统已不能很好地适应系统的要求。在这种情况下,推出了增强的文件系统FAT32。同FAT16相比,FAT32主要具有以下特点:
- 1.同FAT16相比FAT32最大的优点是可以支持的磁盘大小达到32GB,但是不能支持小于512MB的分区。
基于FAT32的Win 2000可以支持分区最大为32GB;而基于 FAT16的Win 2000支持的分区最大为4GB。
- 1.由于采用了更小的簇,FAT32文件系统可以更有效率地保存信息。如两个分区大小都为2GB,一个分区采用了FAT16文件系统,另一个分区采用了FAT32文件系统。采用FAT16的分区的簇大小为32KB,而FAT32分区的簇只有4KB的大小。这样FAT32就比FAT16的存储效率要高很多,通常情况下可以提高15%。
- 2.
NTFS文件系统是一个基于安全性的文件系统,是Windows NT所采用的独特的文件系统结构,它是建立在保护文件和目录数据基础上,同时照顾节省存储资源、减少磁盘占用量的一种先进的文件系统。使用非常广泛的Windows NT 4.0采用的就是NTFS 4.0文件系统,相信它所带来的强大的系统安全性一定给广大用户留下了深刻的印象。Win 2000采用了更新版本的NTFS文件系统NTFS 5.0,它的推出使得用户不但可以像Win 9X那样方便快捷地操作和管理计算机,同时也可享受到NTFS所带来的系统安全性。
NTFS 5.0的特点主要体现在以下几个方面:
- 1.
- 2.
- 3.
- 4.NTFS采用了更小的簇,可以更有效率地管理磁盘空间。在Win 2000的FAT32文件系统的情况下,分区大小在2GB~8GB时簇的大小为4KB;分区大小在8GB~16GB时簇的大小为8KB;分区大小在16GB~32GB时,簇的大小则达到了16KB。而Win 2000的NTFS文件系统,当分区的大小在2GB以下时,簇的大小都比相应的FAT32簇小;当分区的大小在2GB以上时(2GB~2TB),簇的大小都为4KB。相比之下,NTFS可以比FAT32更有效地管理磁盘空间,最大限度地避免了磁盘空间的浪费。
- 5.在NTFS分区上,可以为共享资源、文件夹以及文件设置访问许可权限。许可的设置包括两方面的内容:一是允许哪些组或用户对文件夹、文件和共享资源进行访问;二是获得访问许可的组或用户可以进行什么级别的访问。访问许可权限的设置不但适用于本地计算机的用户,同样也应用于通过网络的共享文件夹对文件进行访问的网络用户。与FAT32文件系统下对文件夹或文件进行访问相比,安全性要高得多。另外,在采用NTFS格式的Win 2000中,应用审核策略可以对文件夹、文件以及活动目录对象进行审核,审核结果记录在安全日志中,通过安全日志就可以查看哪些组或用户对文件夹、文件或活动目录对象进行了什么级别的操作,从而发现系统可能面临的非法访问,通过采取相应的措施,将这种安全隐患减到最低。这些在FAT32文件系统下,是不能实现的。
- 6.
- 7.
(全称Extended File Allocation Table File System,扩展FAT,即扩展文件分配表)是Microsoft在Windows Embeded 5.0以上(包括Windows CE 5.0、6.0、Windows Mobile5、6、6.1)中引入的一种适合于闪存的文件系统,为了解决FAT32等不支持4G及其更大的文件而推出。对于闪存,NTFS文件系统不适合使用,exFAT更为适用。相对FAT文件系统,exFAT有如下好处:
2·单文件大小最大可达16EB(就是理论值,16×1024×1024TB,1TB=1024G)
3·簇大小可高达32MB
5·同一目录下最大文件数可达65 536个
6·支持访问控制
7·支持TFAT
下面请看exFAT、NTFS、FAT分区的比较:
文件系统 | 操作系统 | 最小扇区 | 最大扇区 | 最大单一文件 | 最大格式化容量 | 档案数量 |
FAT32 | Win 95 OSR2之后 | 512bytes | 64KB | 2bytes-4GB | 2TB(但NT内核系统限制为32GB) | 4194304 |
NTFS | Win2000之后 | 512bytes | 64KB | 受最大分割容量 | 2TB~256TB(受MBR影响) | 无 |
exFAT | Win CE 6/Vista SP1/Win 8 | 512bytes | 32768KB | 16EB(理论值) | 16EB(理论值)(目前支持到256TB) | 至少可以大于1000 |
RAW文件系统是一种磁盘未经处理或者未经格式化产生的文件系统,一般来说有这几种可能造成正常文件系统变成RAW文件系统:
●没有格式化。
●硬盘出现不可预知的错误。
解决RAW文件系统的最快的方法是立即格式化,并且使用杀毒软件全盘杀毒。当然,如果文件很重要的话可以考虑用磁盘数据恢复软件先救出数据,然后再格式化和杀毒,或者在网上查找一些有关于“raw文件系统恢复”的内容。
Ext3是一种日志式文件系统,是对ext2系统的扩展,它兼容ext2。日志式文件系统的优越性在于:由于文件系统都有快取层参与运作,如不使用时必须将文件系统卸下,以便将快取层的资料写回磁盘中。因此每当系统要关机时,必须将其所有的文件系统全部shutdown后才能进行关机。
如果在文件系统尚未shutdown前就关机 (如停电) 时,下次重开机后会造成文件系统的资料不一致,故这时必须做文件系统的重整工作,将不一致与错误的地方修复。然而,此一重整的工作是相当耗时的,特别是容量大的文件系统,而且也不能百分之百保证所有的资料都不会流失。
由于资料的写入动作包含许多的细节,像是改变文件标头资料、搜寻磁盘可写入空间、一个个写入资料区段等等,每一个细节进行到一半若被中断,就会造成文件系统的不一致,因而需要重整。
然而,在日志式文件系统中,由于详细纪录了每个细节,故当在某个过程中被中断时,系统可以根据这些记录直接回溯并重整被中断的部分,而不必花时间去检查其他的部分,故重整的工作速度相当快,几乎不需要花时间。
Linux kernel 自 2.6.28 开始正式支持新的文件系统 Ext4。Ext4 是 Ext3 的改进版,修改了 Ext3 中部分重要的数据结构,而不仅仅像 Ext3 对 Ext2 那样,只是增加了一个日志功能而已。Ext4 可以提供更佳的性能和可靠性,还有更为丰富的功能:
- 1.
- 2.更大的文件系统和更大的文件。较之 Ext3 目前所支持的最大 16TB 文件系统和最大 2TB 文件,Ext4分别支持 1EB(1,048,576TB, 1EB=1024PB, 1PB=1024TB)的文件系统,以及 16TB 的文件。
- 3.无限数量的子目录。Ext3 目前只支持 32,000 个子目录,而Ext4支持无限数量的子目录。
- 4.
- 5.多块分配。当写入数据到 Ext3 文件系统中时,Ext3 的数据块分配器每次只能分配一个 4KB 的块,写一个 100MB 文件就要调用 25,600 次数据块分配器,而Ext4的多块分配器“multiblock allocator”(mballoc) 支持一次调用分配多个数据块。
- 6.延迟分配。Ext3 的数据块分配策略是尽快分配,而Ext4和其它现代文件操作系统的策略是尽可能地延迟分配,直到文件在 cache 中写完才开始分配数据块并写入磁盘,这样就能优化整个文件的数据块分配,与前两种特性搭配起来可以显著提升性能。
- 7.快速 fsck。以前执行 fsck 第一步就会很慢,因为它要检查所有的 inode,现在Ext4给每个组的 inode 表中都添加了一份未使用 inode 的列表,今后 fsck Ext4 文件系统就可以跳过它们而只去检查那些在用的 inode 了。
- 8.日志校验。日志是最常用的部分,也极易导致磁盘硬件故障,而从损坏的日志中恢复数据会导致更多的数据损坏。Ext4的日志校验功能可以很方便地判断日志数据是否损坏,而且它将 Ext3 的两阶段日志机制合并成一个阶段,在增加安全性的同时提高了性能。
- 9.
- 10.在线碎片整理。尽管延迟分配、多块分配和 extents 能有效减少文件系统碎片,但碎片还是不可避免会产生。Ext4支持在线碎片整理,并将提供 e4defrag 工具进行个别文件或整个文件系统的碎片整理。
- 11.
- 12.持久预分配(Persistent preallocation)。P2P 软件为了保证下载文件有足够的空间存放,常常会预先创建一个与所下载文件大小相同的空文件,以免未来的数小时或数天之内磁盘空间不足导致下载失败。Ext4在文件系统层面实现了持久预分配并提供相应的 API(libc 中的 posix_fallocate()),比应用软件自己实现更有效率。
- 13.
Btrfs(通常念成Butter FS),是由Oracle于2007年宣布并进行中的copy-on-write文件系统。目标是取代Linux目前的ext3文件系统,改善ext3的限制,特别是单个文件的大小,总文件系统大小或文件检查和加入目前ext3未支持的功能,像是 writable snapshots、snapshots of snapshots、内建磁盘阵列(RAID)支持,以及 subvolumes。Btrfs 也宣称专注在“容错、修复及易于管理”。
ZFS源自于Sun Microsystems为Solaris操作系统开发的文件系统。ZFS是一个具有高存储容量、文件系统与卷管理概念整合、崭新的磁盘逻辑结构的轻量级文件系统,同时也是一个便捷的存储池管理系统。ZFS是一个使用CDDL协议条款授权的开源项目。
HFS首次出现在1985年9月17日,作为Macintosh电脑上新的文件系统。它取代只用于早期Mac型号所使用的平面文件系统Macintosh File System(MFS)。因为Macintosh电脑所产生的数据,比其它通常的文件系统,如DOS使用的FAT或原始Unix文件系统所允许存储的数据更多。苹果电脑开发了一种新式更适用的文件系统,而不是采用现有的规格。例如,HFS允许文件名最多有31个字符的长度,支持metadata和双分支(每个文件的数据和资源支分开存储)文件。
组成一个HFS卷需要下面的五个结构:
- 1.卷的逻辑块0和1是启动块,它包含了系统启动信息。例如,启动时载入的系统名称和壳(通常是Finder)文件。
- 2.逻辑块2包含主目录块(Master Directory Block,简称MDB)。
- 3.逻辑块3是卷位图(Volume Bitmap)的启动块,它追踪分配块使用状态。
- 4.总目录文件(Catalog File)是一个包含所有文件的记录和储存在卷中目录的B*-tree。
- 5.扩展溢出文件(Extent Overflow File)是当最初总目录文件中三个扩展占用后,另外一个包含额外扩展记录的分配块对应信息的B*-tree。
HFS+文件系统相对于HFS文件系统的特点
1、采用32bit 记录分配块数量
HFS 和HFS+文件系统对磁盘卷采用分块进行分配,将一个卷分成等大的分配块。HFS文件系统采用16bit 来记录分配块的数量,最多只能描述216个分配块。而对于HFS+文件系统,采用32bit 来记录分配块的数量,最多能描述232 个分配块。对于Mac 系统上的非空数据,都必须占用整数个分配块,也就是说,即使一个数据只有一个字节,也要占用一个分配块。而HFS+文件系统增大了每个卷分配块的数量,可以使分配块的单位空间更小,从而达到减少存储空间浪费的目的。
2、目录树节点大小增加到4KB
HFS 文件系统的单一文件大小上限为2^31bit,而HFS+文件系统的单一文件大小最大可达到2^63bit。
4、支持长文件名
ReiserFS,是一种文件系统格式,作者是Hans Reiser及其团队Namesys,1997年7月23日他将ReiserFS文件系统在互联网上公布。Linux内核从2.4.1版本开始支持ReiserFS。
ReiserFS 的命名是源自作者Hans Reiser的姓氏,这个日志型文件系统发展比ext2/3 晚近许多。在技术上使用的是 B*-tree 为基础的文件系统,其特色为能很有效率地处理大型文件到众多小文件都可以用很高的效率处理;实务上 ReiserFS 在处理文件小于 1k 小文件时,甚至效率可以比ext3快约10倍。
ReiserFS原先是Novell公司的SuSE Linux Enterprise采用的缺省文件系统,直到2006年10月12日其宣称将在未来的版本改采ext3为缺省。Novell公司否认这与Hans Reiser被控杀妻案有任何关系。
JFS( JOURNAL FILE SYSTEM),一种字节级日志文件系统,借鉴了数据库保护系统的技术,以日志的形式记录文件的变化。JFS通过记录文件结构而不是数据本身的变化来保证数据的完整性。这种方式可以确保在任何时刻都能维护数据的可访问性。
该文件系统主要是为满足服务器(从单处理器系统到高级多处理器和群集系统)的高吞吐量和可靠性需求而设计、开发的。JFS文件系统是为面向事务的高性能系统而开发的。在IBM的 [5]AIX系统上,JFS已经过较长时间的测试,结果表明它是可靠、快速和容易使用的。2000年2月,IBM宣布在一个开放资源许可证下移植Linux版本的JFS文件系统。JFS也是一个有大量用户安装使用的企业级文件系统,具有可伸缩性和健壮性。与非日志文件系统相比,它的突出优点是快速重启能力,JFS能够在几秒或几分钟内就把文件系统恢复到一致状态。虽然JFS主要是为满足服务器(从单处理器系统到高级多处理器和群集系统)的高吞吐量和可靠性需求而设计的,但还可以用于想得到高性能和可靠性的客户机配置,因为在系统崩溃时JFS能提供快速文件系统重启时间,所以它是因特网文件服务器的关键技术。使用数据库日志处理技术,JFS能在几秒或几分钟之内把文件系统恢复到一致状态。而在非日志文件系统中,文件恢复可能花费几小时或几天。
VMware Virtual Machine File System (VMFS )是一种高性能的群集文件系统,它使 [6]虚拟化技术的应用超出了单个系统的限制。VMFS的设计、构建和优化针对 [7]虚拟服务器环境,可让多个 [8]虚拟机共同访问一个整合的群集式存储池,从而显著提高了资源利用率。VMFS 是跨越多个服务器实现虚拟化的基础,它可启用VMware VmotionTM 、Distributed Resource Scheduler 和 VMware High Availability 等各种服务。VMFS 还能显著减少管理开销,它提供了一种高效的虚拟化管理层,特别适合大型企业数据中心。采用 VMFS 可实现资源共享,使管理员轻松地从更高效率和存储利用率中直接获益。
XFS 是 Silicon Graphics,Inc. 于 90 年代初开发的文件系统。它至今仍作为 SGI 基于 IRIX 的产品(从工作站到 [9]超级计算机)的底层文件系统来使用。现在,XFS 也可以用于 Linux。XFS 的 Linux 版的到来是激动人心的,首先因为它为 Linux 社区提供了一种健壮的、优秀的以及功能丰富的文件系统,并且这种文件系统所具有的可伸缩性能够满足最苛刻的存储需求。
UFS文件系统:基于BSD高速文件系统的传统UNIX文件系统,是Solaris的默认文件系统。默认启用UFS 日志记录功能。在早期的Solaris 版本中,UFS 日志记录功能只能手动启用。Solaris 10在运行64位Solaris内核的系统上支持多TB UFS文件系统。以前,UFS文件系统在64位系统和32位系统上的大小仅限于约1 TB(Tbyte)。现在,所有UFS文件系统命令和公用程序已更新为支持多TB UFS文件系统。
UFS1文件系统是OpenBSD和Solaris的默认文件系统。UFS1也曾是NetBSD和FreeBSD的默认文件系统,但NetBSD2.0和FreeBSD5.0以后版本开始使用UFS2做默认的文件系统。UFS2增加了对大文件和大容量磁盘的支持和一些先进的特性。目前似乎还只有FreeBSD和NetBSD支持UFS2。Apple OS X和Linux也支持UFS1,但并不做为它们的默认文件系统。
VeritasFileSystem(VxFS)是首个商业日志记录文件系统。通过日志记录功能,元数据更改首先写入到日志,然后再写入到磁盘。由于无需在多处写入更改,且元数据是异步写入的,因此吞吐量的速度较快。VxFS也是基于扩展区的意向日志记录文件系统。VxFS设计用于要求高性能和高可用性,并且可以处理大量数据的操作环境。
ReFS(Resilient File System,弹性文件系统) 是在Windows 8.1和Server® 2012中新引入的一个文件系统。ReFS是与NTFS大部分兼容的,其主要目的 是为了保持较高的稳定性,可以自动验证数据是否损坏,并尽力恢复数据。
ReFS 的关键功能如下:
·支持超大规模的卷、文件和目录
·存储池和虚拟化使得文件系统可建立并易于管理
·通过磁盘扫描防止潜在的磁盘错误
·借助“数据打捞”实现损坏还原,以便在任何情况下尽可能提高卷的可用性