一、全链接指针B~+树的研究(论文文献综述)
张明杰,王静平[1](2019)在《态势实时显示与回放系统的设计与实现》文中进行了进一步梳理为了对战场态势进行实时显示和回放,设计并实现了一个态势实时显示与回放相结合的软件系统。该系统可从通信网络实时接收数据报文,从数据报文中提取航迹点并将航迹点作为索引元素(关键字)存储在B+树文件中;然后从B+树文件中读取态势数据,完成态势的计算、实时显示或回放。基于MFC框架、多线程技术对该系统进行了编程实现,并用真实的数据集进行了长时间的运行实验,实验结果表明系统设计与实现的正确性、稳定性和有效性。
牛德姣[2](2018)在《面向序列数据分析的分布式存储与计算技术研究》文中研究说明序列数据是大数据中快速增长的一类数据形式。不同于一般数据,序列数据中存在依赖关系,发现并挖掘其中的潜在依赖是分析序列数据的关键。当前,序列数据分析已被广泛应用于语言、音视频、金融、医学、生物、物联网、交通等多个领域,成为大数据智能研究的一个热点。除了序列数据蕴含的依赖关系具有跨度大、隐蔽深等特点外,序列数据量的爆炸式增长也使得传统的序列数据分析方法难以有效适应。以循环神经网络(Recurrent Neural Network,RNN)和长短时记忆网络(Long Short Term Memory,LSTM)为代表的循环神经网络理论上可学习任意长度序列数据中的依赖关系,是当前分析序列数据的重要方法。但在训练用于分析序列数据的循环神经网络时,涉及大量参数,还需要使用海量训练集通过大量迭代计算不断更新参数,这使得训练循环神经网络同时具有了大数据处理与高性能计算两方面的特性。因此如何针对用于分析序列数据的循环神经网络的特性,研究新型的分布式存储与计算系统,是提高循环神经网络训练效率与分析序列数据准确性的重要问题。本文首先分析了序列数据分析相关技术与研究现状,给出了当前影响序列数据分析模型训练效率和准确性的主要挑战。在此基础上研究和设计了面向序列数据分析分布式存储与计算系统的结构,为了提高序列数据分析模型的训练效率和准确性,从节点存储方法、分布式数据与元数据管理方法、以及基于分布式存储与计算的序列数据分析模型训练方法这三个方面展开研究。1)提出了基于非易失存储器(Non-volatile Memory,NVM)的节点存储方法,包括基于NVM的快速文件系统和NVM非对称访问算法。实现了原型系统,使用通用测试工具进行了测试与分析,验证了基于NVM节点存储方法能大幅提高访问数据的I/O性能、缩短访问响应时间,从而支撑序列数据分析模型参数与训练集的快速访问。2)提出了面向序列数据分析的分布存储方法,在使用分布式存储系统中元数据和数据分别存储、管理序列数据分析模型中参数与训练集的基础上,提出了元数据分级管理算法和基于NVM的数据分布管理算法。实现了原型系统,使用通用测试工具进行了测试与分析,验证了元数据分级管理算法能减少查找元数据所需的时间与空间开销、并具有很强的适应能力;基于NVM数据分布管理算法能提高读写速度和IOPS的值,为提高训练序列数据分析模型的并行分布处理效率提供了支撑。3)提出了用于分析序列数据的循环神经网络分布式训练方法,针对分析序列数据的循环神经网络训练效率问题,通过合理分布模型参数、训练集及其训练计算任务,将分布式系统中节点的计算和存储相结合,结合序列数据自身特性,分别提出了基于分布式存储与计算的自主循环神经网络、基于神经元动态激活的快速训练算法和融合时长的自适应LSTM。实现了原型系统,进行了测试与分析,验证了所提出的方法能提高用于分析序列数据的循环神经网络训练效率、分析序列数据的准确性,并增强模型可扩展性。
张明杰[3](2018)在《一种基于B+树航迹态势回放系统的设计与实验》文中指出为了对某大型电子信息系统感知的态势进行高效地回放,设计并实现一种基于B+树的态势回放软件系统。该系统的工作过程分为两个阶段:初始化阶段,从态势数据文件中提取所有航迹点,将航迹点作为关键字插入B+树文件;态势回放阶段,根据指定的时间窗从B+树文件中获取航迹点集合,依据同迹关系对航迹点集合进行划分,形成态势并将其显示在图形界面上。在通用的个人台式机上实现了该系统,并以该大型电子信息系统的态势数据对系统的性能进行测试。实验结果表明,该系统可对海量态势数据进行高效地处理和回放。
刘昊[4](2018)在《面向非易失性内存的系统软件若干问题的研究》文中进行了进一步梳理随着大数据时代的来临和数据科学发展的不断深入,被采集,存储和处理的数据量急剧膨胀,传统计算机体系架构中以“计算为中心”的模式,难以应对数据规模与数据处理能力之间日益突出的矛盾,现存的计算机体系架构面临着严峻的挑战和生存瓶颈。近年来,随着新型非易失性内存介质技术的兴起,打破传统的体系架构,构建大容量,非易失,高可靠的内存系统,将数据大量或整体存放于内存中,形成以内存为主体的新型内存计算模式,从而完成计算模式从以“计算为中心”向以“数据为中心”的转变,成为学术界和工业界关注的热点。该技术减少了数据存储的软件层次,降低了数据访问的延迟,提升了数据处理的性能,具备相当的创新价值和市场价值,成为学术界和工业界关注的热点。其中,将非易失性内存引入计算机内存系统中,构建既有易失性内存又有非易失性内存的内存系统,又成为研究热点中的热点,吸引了大量的学术界研究者和行业翘楚的目光。本论文以非易失性内存为介质背景,基于异构混合内存体系架构,以存储类的系统软件为研究对象,主要探讨非易失性内存介质引入后对软件设计带来的影响与变化,提出在异构混合内存体系架构下,存储类软件设计面临的挑战和解决方法,选取了具有代表性的存储类系统软件,文件系统和键值对数据库系统,详细阐述基于非易失性内存环境下文件系统以及键值对系统的设计原理,实现方法,数据一致性保障机制,实验验证等方面的问题。在文件系统层面,针对文件系统的数据一致性问题,对文件系统的数据一致性给出了层次划分,并针对较高层级的版本数据一致性给出了一种新型的多版本一致性保障机制,论证了该多版本一致性机制的有效性和正确性。针对非易失性内存有限的访问寿命,文件系统采用了日志型的数据更新方式,尽量保证对底层非易失性内存介质的均匀访问,提升系统的耐久性和非易失性介质的使用寿命,并通过实验的方法验证了日志型文件系统设计方法对非易失性内存介质的访问均衡的改善效果。在键值对系统层面,针对现有键值对系统在整个系统中所占据的位置和作用,提出不依靠文件系统直接将键值对存储在非易失性内存的存储方法,减少了存储软件栈的层级,降低了系统数据持久化的代价。同时,基于散列表为主要存储数据结构,分别在传统内存DRAM和新型非易失性内存NVM中上使用静态散列表和动态散列表,该设计有效地取得了系统性能和内存使用效率的平衡,解决了数据量不固定的前提下,散列表容量难以固定初始化的问题,大大提升了系统的可移植性和普适性。本文以非易失性内存为主要介质背景,以存储类系统软件为主要研究对象,以文件系统和键值对存储系统为具体研究对象,提出了基于非易失性内存环境下,存储类系统软件的设计和实现方法,并讨论了数据一致性保障机制的实现方法,提出了一种新型的,有效的数据一致性保障机制。本论文的主要工作及创新如下:1.设计并实现了一个异构混合内存文件系统HMFS,该文件系统基于异构混合内存体系架构,以非易失性内存为主要存储介质,具备多版本控制和版本一致性保障机制,实现了文件系统中较高级别的一致性保障层级,文件系统中对文件系统元数据和数据采用不同的更新方式,对于文件系统数据采用原地更新方式,并缓存一部分在DRAM中,以提高数据查找的速度,对于文件系统数据采用日志型的更新方式,以实现对内存介质的尽量均匀访问,增长NVM介质的使用寿命。该文件系统提出了一种基于图的多版本控制数据结构,并给出一系列的的多版本操作相关算法设计,该设计打破了传统基于树结构的多版本实现方法,提升了版本生成,删除和获取的性能,降低了文件系统元数据的体量大小,设计并实施了全面的实验方案,从性能,多版本有效性以及介质耐久性等多个方面评测了文件系统性能,多版本有效性和对底层非易失性内存介质的访问均衡。2.设计并实现了一套文件系统多版本实现机制,该机制以一种新型的支持多版本功能的数据结构和一套完整的版本控制算法组成,实现了版本控制的基本功能,如创建、读取、删除等,并实现了完全的多版本功能,即可基于已存于系统中的任一版本进行版本演化,子版本与父版本之间无严格的生成时间先后顺序限制,并可以基于多个版本进行版本合并等,该多版本控制机制有效地提升了版本生成,读取和删除的性能,并实现了空间利用效率的提升。该多版本机制同时支持逆向查找功能,可以确定同一个文件属于哪些版本,并可以列出文件及所属版本的信息,该多版本控制机制有别于现存的多版本控制机制,全面支持多版本功能的所有操作,并降低了维护多版本所需的元数据量,在提升性能的同时取得了良好的空间利用效率。3.设计并实现了一个异构混合内存键值对系统LibreKV,该键值对系统基于异构混合内存体系架构,以非易失性内存为主要存储介质,使用静态散列表和动态散列表相结合的设计方法,实现系统性能和内存使用效率的平衡,提出一套动态扩展机制,实现散列表大小的动态扩展和内存的按需分配。利用传统内存的高性能特点,在DRAM中对键值对的读写请求进行快速响应,利用新型非易失性内存容量大,存储密度高的特点,完成对键值对的持久存储,并在DRAM和NVM中使用不同的散列表结构,DRAM中使用静态散列表结构,在静态散列表中使用布谷鸟散列算法,该方法可快速接收来自客户端的读写请求,并使静态散列表到达较高的使用效率。在NVM中,使用动态散列表和动态扩展算法,以实现散列表规模随实际数据量大小而动态改变的功能,提高了系统的自适应性和可扩展性。同时,针对键值对系统数据吞吐率高,对数据响应速度要求较高的特点,在数据一致性保障方面,摒弃了传统的使用高代价的硬件原语来保证内存写顺序的方法,采用了基于键值对校验和和合并检查点的一致性保障机制,该机制有效地结合了动态散列表和检查点机制的特性,有效降低了系统恢复时所需要检验的键值对个数,避免了因维护一致性而导致的过大的系统开销,提升了系统性能。4.提出一种基于校验和检查点技术的数据一致性保障机制,并将其应用于异构混合内存键值对系统LibreKV中,结合基于动态散列表的检查点机制,实现键值对系统数据一致性的保障,该一致性保障机制,避免了使用硬件原语保证写顺序来维护一致性的开销,降低了系统开销,提升了系统性能。该一致性保障机制可以充分利用键值对系统计算键值散列值的特性,利用简单的算法计算键值对散列值,并将散列值作为元数据一部分进行存储,作为发生系统异常和一致性检验时的依据。该方法非常适用于单个数据体量不太大的键值对存储系统,具有良好的应用系统场景,适应了系统的设计需求,完成了系统的基本要求,为在非易失性内存中设计有效的数据一致性保障机制维护数据的最终一致性并完成键值对在非易失性内存介质上的持久存储提供了一种参考方案。
肖蒙[5](2016)在《数据库中一种分段混合时态索引的研究与实现》文中进行了进一步梳理时至今日,大数据时代已然来临。大数据及其中包含的大量信息,已成为了各行各业极为重要的决策资料。时间作为客观事物发展变化的基本描述,几乎所有信息都显式或隐式地具备时态特征。大数据的产生往往也是经过时间累积形成的,天然的具备时态属性。因此,对时态数据的有效支持已成为目前各行业应用的迫切要求。然而,传统基于快照的数据库技术仅能反映对象在某个时刻的状态,对时态信息的存储、处理十分有限。如何在海量数据库中对时态数据进行有效管理以支持快速、高效地检索到用户所需要的时态信息已经成为研究的热点。时态索引是时态数据库中加速查询的重要手段之一。然而,现有的时态索引技术主要针对时态属性创建索引结构,难以有效地支持用户的多样性查询。此外,由于时态数据库中数据的持续更新,使得目前的索引技术在保障查询执行高效性的同时,难以兼顾索引创建和维护的高效性。为此,本文针对时态数据库特性,就如何创建有效的索引结构,满足用户多样性的查询要求进行了研究。首先,论文阐述了信息时代时态数据管理的重要意义,并且对时态数据库的发展历程和国内外时态索引技术的现状进行了分析,总结了这些索引技术的特征和不足之处。其次,论文对数据库中索引技术进行了详细地介绍,其中包括B+树索引,以及SAP HANA中的Timeline索引,介绍了其查询、插入和删除等操作的实现,对其索引创建和维护的效率及满足多样性查询的局限性进行了分析。此外,介绍了分区索引加速并行的可行技术。再次,本文深入研究了数据库中满足多样性查询需求的时态索引技术,提出了一种面向时态数据的分段混合索引——SHB+树(Segmentation Hybrid B+-Tree,SHB+-Tree)索引。该技术首先将时态数据表按时间进行分段,在每个分段上建立局部的时间和对象的混合索引结构,时间和对象索引部分共享局部分段中的时态数据。进而,将用户查询分为四类,分别为时间版本查询、对象查询、复杂查询和跨时间段查询,本文详细介绍了基于SHB+树的四类查询实现方法。由于SHB+树索引结构有效的集中了对象索引和时态索引的优势,因此可高效的支持上述多种类型的查询执行。此外,对于每个局部分段混合索引,本文设计了自底向上的索引创建方式,结合分段索引策略,提高索引创建和维护的效率。最后,本文具体实现了上述的各项关键技术,并以基准数据集进行实验。通过对这些测试结果进行对比分析,验证了本文所描述内容的正确性及有效性。在处理时态数据时,该索引技术能够在满足用户多样性查询要求的同时,提高查询性能。
孙德才,王晓霞[6](2014)在《一种基于Bigram二级哈希的中文索引结构》文中进行了进一步梳理为通过构建高速的中文索引结构来提高Off-line模式的串匹配速度,提出了一种基于Bigram二级哈希的中文索引结构。该索引采用中文GB2312编码处理中文汉字,以中文Bigram项作为词汇项,并实现了基于二级哈希的词汇表存储结构。实验数据显示,本文索引结构虽然占用存储空间为词索引的2倍多,但其匹配速度是词索引的4倍多。结果表明本文索引在中文匹配中具有速度优势。
翟建东[7](2011)在《闪存碎片影响分析与闪存数据库索引技术研究》文中研究表明闪存存储器由于具有存储容量大、体积小、掉电数据不丢失、抗震性好、存取高速等优点,已逐步取代其它半导体存储器件而广泛应用于MP3、存储卡、手机、PDA等移动电子产品中。同时,随着闪存制造工艺技术的发展以及单位价格的下降,闪存存储器越来越多地被应用到个人电脑、企业服务器等大容量存储当中,例如现在市场流行的iPad的存储器正是采用了闪存。闪存存储管理技术,尤其是对于解决大容量数据存储管理的闪存数据库技术已成为研究的重点。本文介绍了现有的闪存存储管理技术,重点分析了基于日志管理的闪存存储管理技术;根据闪存在存储过程中的合并方式的代价不同,分析了碎片对闪存产生影响的原因,并依据其产生的原因,给出了通过填补间隔来改变合并方式的改进方案,将碎片写入方式转变成连续写入方式,提高了闪存的存储性能。本文分析了闪存数据库的主要研究方向,重点讨论了闪存数据库的索引技术。本文主要研究内容是将B+树索引结构高效地应用到闪存数据库系统中。为此,本文根据闪存的物理特性,并结合现有的闪存存储管理技术,在应用层与闪存转换层之间设计了一个改进的B+树实现层MB+,该实现层主要由两部分组成:批处理缓存区BPB和叶子结点头LNH,用来减少闪存数据库更新时对闪存的写入操作次数,同时提高了闪存数据库的查询效率。通过实验与性能分析,证明本文提出的方案很好地提高了闪存数据库的性能。
李鸿泉[8](2011)在《数据库效率比较研究及其在居民健康档案管理中的应用》文中进行了进一步梳理数据库近年来一直都是国内外研究的热点。数据库在数据存储领域中扮演着非常重要的角色。数据库的存储和查询性能是判断数据库好坏重要的参数。在应用开发基于数据库的应用系统之前,如何通过数据库的性能来选择出最佳的数据库成为了一个难题。在本文中主要使用数据库性能代价的精确分析模型来分析Cache数据库,Oracle数据库和DB2数据库的存储和查询代价。其中Oracle公司的Oracle数据库和IBM公司的DB2数据库是当前数据库市场中最典型的关系型数据库,而InterSystems公司的Cache数据库是第三代面向对象数据库的杰出代表。通过性能代价的精确分析模型研究得出各个数据库的存储代价和查询效率公式之后,再使用实际数据库的参数来进行计算,对比计算结果找出存储性能和查询效率最佳的数据库。在数据库中使用的记录是社区卫生信息管理系统中最重要的一部分——居民健康档案的基本信息。通过实际数据库操作对比这三种数据库的存储空间大小和查询记录的时间,找出性能最佳的数据库。通过对比结果来验证从分析模型中得出的结论是否正确。
李春山[9](2009)在《基于B*树和B+树融合索引的海量URL管理技术》文中研究表明海量URL的高效存储和快速访问是高性能Web爬虫的关键技术。现有的海量URL数据管理技术大部分是基于B树或B+树索引结构的。B+树索引的特点是支持动态操作,其更新速度很快但是空间利用率很低。这种现象导致了B+树索引树高的增加,检索速度的下降。B*树结构可以大幅度的提高B+树节点的空间利用率,这种结构通过延缓分裂操作来达到提高空间利用率,但是B*树索引的更新速度远远不能满足我们高性能WEB爬虫的需要。本文通过对聚焦爬虫在网络上爬行过程的深入分析,明晰了爬虫运行时对URL数据管理的主要技术需求,针对B*树更新效率低下的问题,提出了一种新的索引结构——B+树和B*树融合的索引结构,并基于该索引结构设计出海量URL的存储、快速更新和访问方法。本文的主要贡献体现在以下几个方面:(1)本文结合B+树和B*树的优点,设计了NPB+Tree索引和NPB+Tree节点结构。这种索引在高速插入时只对叶子节点进行B*树的维护操作,而对B+的内节点的操作采取B+树的更新操作。在叶子节点上,NPB+Tree索引通过采用延缓分裂的操作提高了索引的叶子节点的空间利用率,间接减少了内节点数目,降低了树高。同时NPB+Tree在所有节点上继续使用B+树的分裂操作,维持了高速更新。这种索引更新和随机查询速度极其稳定,能够满足WEB爬虫对URL数据管理的速度需求。(2)文中的NPB+Tree节点的新结构通过增加指针来获取更好的时间效率,它不仅在能加速NPB+Tree的维护操作,而且对缓存的管理也有很大帮助。(3)此外,本文通过分析爬虫下载得到的URL数据的分布模式,获得了URL数据预取算法。接着设计了高速数据缓存系统。然后使用任务流水线技术和写入缓存排序等优化方案进一步加速了爬虫URL管理系统的运行速度,使得更新速度比无缓存时增加了4倍。最后通过实验讨论证明了我们的结论。基于以上研究成果,本文设计了由URL任务流水线调度模块、URL数据哈希模块、URL索引管理模块、URL缓存管理模块和URL记录管理模块等5个部分组成的URL管理系统的体系结构,并且编程实现了这个原型系统。为高性能WEB爬虫的设计打下了坚实基础。
刘玉喜,刘玉华[10](2008)在《B+树的研究》文中研究指明在对比传统的树的定义和操作算法的基础上,定义了一种更适合于物理索引文件结构设计的树——FLP树。经过对数据的研究和分析表明,与一般树相比,FLP树具有更高的空间利用效率。同时,为FLP树索引文件设计了一种全链接的指针结构,以提高系统故障恢复的能力,以及在故障恢复期间保持等效的不中断服务的能力,亦即系统的有效性。
二、全链接指针B~+树的研究(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、全链接指针B~+树的研究(论文提纲范文)
(1)态势实时显示与回放系统的设计与实现(论文提纲范文)
1 系统功能与关键技术 |
1.1 数据存储与查询 |
1.2 态势实时计算与显示 |
2 系统设计 |
2.1 架构设计 |
2.2 接口设计 |
2.2.1 数据接口设计 |
2.2.2 功能接口设计 |
2.3 界面设计 |
2.4 系统工作流程设计 |
3 系统实现与实验 |
3.1 系统实现及运行 |
3.2 系统实验 |
3.3 态势实时计算与显示性能 |
4 结束语 |
(2)面向序列数据分析的分布式存储与计算技术研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 相关技术 |
1.3 论文的主要研究内容及结构 |
第二章 国内外研究现状 |
2.1 序列数据分析方面的研究 |
2.2 新型存储子系统方面的研究 |
2.3 本章小结 |
第三章 新型分布式存储与计算系统的结构 |
3.1 序列数据分析的特性 |
3.2 新型分布式存储与计算系统的结构 |
3.3 新型分布式存储与计算系统的特点 |
3.4 本章小结 |
第四章 基于NVM的节点存储方法 |
4.1 基于NVM的快速文件系统 |
4.2 NVM非对称访问算法 |
4.3 原型的测试与分析 |
4.4 本章小结 |
第五章 面向序列数据分析的分布存储管理方法 |
5.1 元数据分级管理算法 |
5.2 基于NVM的数据分布管理算法 |
5.3 原型的测试与分析 |
5.4 本章小结 |
第六章 序列数据分析模型的分布式训练方法 |
6.1 基于分布式存储与计算的自主循环神经网络 |
6.2 基于神经元动态激活的快速训练算法 |
6.3 融合时长的自适应LSTM |
6.4 实验与分析 |
6.5 本章小结 |
第七章 总结与展望 |
7.1 工作总结 |
7.2 工作展望 |
参考文献 |
致谢 |
在学期间发表的学术论文及其他科研成果 |
(3)一种基于B+树航迹态势回放系统的设计与实验(论文提纲范文)
0 引言 |
1 相关概念 |
1.1 航迹点 |
1.2 航迹点之间的基本关系 |
1.3 有序航迹点集合与同迹关系 |
1.4 航迹 |
1.5 航迹与航迹点匹配 |
1.6 时间窗 |
1.7 有序航迹点集合在时间窗内的投影 |
1.8 态势 |
2 B+树及B+树文件 |
2.1 B+树的定义 |
2.2 B+树文件 |
3 系统的组成、工作流程及关键算法 |
3.1 系统的组织结构 |
3.2 系统的工作流程 |
4 关键算法 |
4.1 航迹点批量插入算法 |
4.2 航迹形成算法 |
5 系统实现及实验 |
5.1 运行环境 |
5.2 系统性能评价指标 |
5.3 系统运行实验 |
6 结语 |
(4)面向非易失性内存的系统软件若干问题的研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 引言 |
1.2 非易失性内存(NVM) |
1.3 内存计算 |
1.4 异构混合内存体系架构 |
1.5 论文主要工作 |
1.6 论文结构安排 |
第二章 文件系统及存储类系统软件相关工作 |
2.1 存储类系统软件主要分类 |
2.2 文件系统 |
2.2.1 Linux文件系统 |
2.3 虚拟文件系统 (VFS) |
2.3.1 VFS简介 |
2.3.2 基本概念 |
2.4 数据库系统 |
2.4.1 关系型数据库系统 |
2.4.2 ACID理论模型 |
2.4.3 非关系型数据库系统 |
2.4.4 CAP理论模型 |
2.4.5 BASE理论模型 |
2.5 键值对数据库系统 |
2.5.1 LSM树数据结构 |
2.5.2 散列表数据结构 |
2.5.3 基于LSM树的键值对存储系统Level DB |
2.5.4 基于散列表的键值对存储系统Redis |
2.6 本章小结 |
第三章 异构混合内存文件系统HMFS |
3.1 前言 |
3.2 研究基础 |
3.2.1 NVM相关基础 |
3.2.2 文件系统一致性 |
3.2.3 文件系统数据更新方法 |
3.3 相关工作 |
3.3.1 非易失性内存介质 |
3.3.2 日志型文件系统 |
3.3.3 异构混合体系架构 |
3.4 文件系统设计 |
3.4.1 HMFS概览 |
3.4.2 HMFS内存布局 |
3.4.3 文件与目录结构 |
3.5 文件系统实现 |
3.5.1 优化的MMap直接访问机制 |
3.5.2 垃圾回收 |
3.5.3 异常恢复与一致性 |
3.6 文件系统实验 |
3.6.1 文件系统实验环境 |
3.6.2 实验结果概述 |
3.6.3 性能实验 |
3.6.4 耐久性 |
3.7 本章小结 |
第四章 内存文件系统多版本实现机制 |
4.1 前言 |
4.2 相关工作 |
4.2.1 多版本功能的用途 |
4.2.2 多版本数据结构 |
4.3 文件系统多版本机制设计 |
4.3.1 多版本文件系统理论模型 |
4.3.2 文件基本操作 |
4.3.3 多版本文件系统数据结构 |
4.3.4 多版本文件系统实例分析 |
4.3.5 文件操作相关算法 |
4.3.6 版本操作相关算法 |
4.3.7 多版本机制总结 |
4.4 多版本文件系统实验 |
4.4.1 实验环境 |
4.4.2 实验结果概述 |
4.4.3 版本有效性 |
4.5 本章小结 |
第五章 异构混合内存键值对存储系统Libre KV |
5.1 前言 |
5.2 相关工作 |
5.3 Libre KV设计与实现 |
5.3.1 Libre KV整体架构 |
5.3.2 Libre KV内存布局 |
5.3.3 Libre KV内部架构 |
5.3.4 Libre KV静态散列表结构 |
5.3.5 Libre KV动态散列表结构 |
5.3.6 Libre KV键值对数据结构 |
5.3.7 Libre KV数据处理流程 |
5.3.8 Libre KV实现概述 |
5.4 实验结果 |
5.4.1 实验环境配置 |
5.4.2 实验方法 |
5.4.3 实验结果 |
5.5 本章小结 |
第六章 Libre KV动态扩展算法与一致性保障机制 |
6.1 前言 |
6.2 相关工作 |
6.3 动态扩展算法 |
6.3.1 静态散列表布谷鸟散列算法 |
6.3.2 散列表静态重构 |
6.3.3 Libre KV动态扩展算法 |
6.4 自适应一致性保障机制 |
6.5 实验验证 |
6.6 本章小结 |
第七章 总结与研究展望 |
7.1 总结 |
7.2 研究展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文 |
攻读学位期间参与的项目 |
攻读学位期间申请的专利 |
(5)数据库中一种分段混合时态索引的研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景 |
1.2 研究现状 |
1.2.1 传统数据库 |
1.2.2 传统索引技术 |
1.2.3 时态数据库 |
1.2.4 时态索引技术 |
1.2.5 时态查询操作 |
1.3 论文研究内容和主要贡献 |
1.4 本文的组织结构 |
第二章 相关基础理论 |
2.1 B+树索引 |
2.1.1 B+树的结构 |
2.1.2 B+树的查询 |
2.1.3 B+树的更新 |
2.1.4 小结 |
2.2 Timeline索引 |
2.2.1 SAP HANA |
2.2.2 Timeline索引结构 |
2.2.3 小结 |
2.3 分区索引 |
2.3.1 数据分区 |
2.3.2 分区索引 |
2.4 本章小结 |
第三章 SHB+树索引的结构与生成技术 |
3.1 定义和符号 |
3.2 SHB+树索引的结构 |
3.3 SHB+树索引的创建与维护 |
3.3.1 数据排序 |
3.3.2 SHB+树的创建 |
3.4 本章小结 |
第四章 SHB+树索引技术的查询实现 |
4.1 SHB+树索引的时间版本查询实现 |
4.1.1 时间索引预处理 |
4.1.2 时间版本查询中的时态聚合查询实现 |
4.1.3 时间版本查询中的时间旅行查询实现 |
4.1.4 时间版本查询中时态连接查询实现 |
4.2 SHB+树索引的对象查询实现 |
4.3 SHB+树索引的复杂查询实现 |
4.4 SHB+树索引的跨时间段查询实现 |
4.5 本章小结 |
第五章 有效性分析 |
5.1 实验环境 |
5.2 数据集 |
5.2.1 时态数据模型 |
5.2.2 具体实现 |
5.2.3 具体数据集 |
5.3 实验结果与评价 |
5.3.1 内存消耗 |
5.3.2 索引创建时间开销 |
5.3.3 时间版本查询操作结果与分析 |
5.3.4 对象查询操作结果与分析 |
5.3.5 复杂查询操作结果与分析 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读学位期间的研究成果目录 |
致谢 |
(7)闪存碎片影响分析与闪存数据库索引技术研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景及意义 |
1.2 闪存数据存储相关技术研究现状 |
1.3 本文研究工作 |
2 碎片影响闪存存储性能分析与改进 |
2.1 闪存存储器及其物理特性 |
2.2 闪存转换层 |
2.3 碎片对闪存的影响分析 |
2.4 改进方案 |
2.5 改进方案性能分析 |
2.6 本章小结 |
3 闪存数据库系统索引结构 |
3.1 B 树及B+树结构 |
3.2 闪存数据库B 树索引结构设计 |
3.3 现有闪存数据库索引技术的不足 |
3.4 本章小结 |
4 闪存数据库系统索引结构优化 |
4.1 优化策略 |
4.2 减少闪存数据库的写入 |
4.3 提高查询速度 |
4.4 叶子结点的分裂 |
4.5 数据库操作的处理算法 |
4.6 改进的最近最少使用数据缓存策略 |
4.7 本章小结 |
5 性能测试 |
5.1 测试环境 |
5.2 测试用例 |
5.3 测试结果及分析 |
5.4 本章小结 |
6 全文总结及展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
附录 攻读学位期间发表学术论文目录 |
(8)数据库效率比较研究及其在居民健康档案管理中的应用(论文提纲范文)
摘要 |
ABSTRACT |
1绪论 |
1.1 课题背景与意义 |
1.2 数据库的发展历史 |
1.3 本文研究目标与内容 |
1.4 论文组织 |
2 数据库存储性能研究 |
2.1 Cache数据库存储技术 |
2.1.1 Cache数据库的特点 |
2.1.2 Cache的存储方式 |
2.1.3 Global存储 |
2.1.4 Cache数据库存储性能分析 |
2.2 Oracle数据库存储技术 |
2.2.1 Oracle数据库的特点 |
2.2.2 Oracle数据库逻辑存储结构 |
2.2.2.1 表空间 |
2.2.2.2 数据块、数据扩展、段之间关系 |
2.2.2.3 数据块 |
2.2.2.4 数据扩展 |
2.2.2.5 段 |
2.2.3 Oracle索引结构 |
2.2.4 Oracle B~*树索引存储性能分析 |
2.3 DB2数据库存储技术 |
2.3.1 DB2数据库特点 |
2.3.2 DB2数据库内部存储结构 |
2.3.2.1 DB2存储层次结构 |
2.3.2.2 数据页 |
2.3.2.3 记录标识(RID)和页 |
2.3.3 DB2数据库索引结构 |
2.3.4 DB2 B~+树索引存储性能分析 |
2.4 本章小结 |
3 数据库查询性能研究 |
3.1 Cache数据库查询性能研究 |
3.2 Oracle数据库查询性能研究 |
3.3 DB2数据库查询性能研究 |
3.4 本章小结 |
4 数据库性能实验对比分析 |
4.1 存储实验性能对比 |
4.2 查询实验性能对比 |
4.3 本章小结 |
5 应用实例 |
5.1 需求描述 |
5.2 居民健康档案的内容 |
5.3 居民健康档案的数据模型 |
5.4 实例应用及分析 |
5.5 本章小结 |
6 结论与展望 |
6.1 结论 |
6.2 展望 |
致谢 |
参考文献 |
(9)基于B*树和B+树融合索引的海量URL管理技术(论文提纲范文)
摘要 |
Abstract |
第1章 绪 论 |
1.1 课题研究背景和意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外相关研究和综述 |
1.2.1 WEB爬虫技术现状 |
1.2.2 URL管理系统技术现状 |
1.3 课题研究内容 |
1.4 本文的结构安排 |
第2章 海量URL存储的关键技术分析 |
2.1 引言 |
2.2 WEB爬虫对海量URL管理的要求 |
2.2.1 Crawler的爬行 |
2.2.2 Crawler对海量URL管理的基本要求 |
2.3 海量URL管理的关键技术 |
2.3.1 URL去重技术 |
2.3.2 海量URL管理系统的索引技术 |
2.3.3 海量数据管理的缓存技术 |
2.3.4 URL数据管理系统运行优化 |
2.4 本章小结 |
第3章 海量URL去重技术和数据存储结构研究 |
3.1 引言 |
3.2 海量URL去重技术 |
3.2.1 URL去重技术的选择 |
3.2.2 URL的哈希函数选择 |
3.3 URL索引存储结构NP_B+TREE |
3.3.1 适用于海量数据管理的NP_B+Tree索引 |
3.3.2 NP_B+Tree的存储结构描述 |
3.3.3 NP_B+Tree的基本操作 |
3.4 NP_B+TREE存储结构的性能分析和实验 |
3.4.1 NP_B+Tree存储空间存储占有量分析 |
3.4.2 NP_B+Tree的更新效率分析 |
3.4.3 NP_B+Tree的查询效率分析 |
3.5 本章小结 |
第4章 基于缓存技术的海量URL管理方案 |
4.1 引言 |
4.2 海量URL数据的预取、缓存策略 |
4.2.1 预取、缓存相结合的访问策略 |
4.2.2 针对URL数据访问方式的数据预取算法 |
4.2.3 预取、缓存模块的性能分析与实验 |
4.3 海量URL管理系统运行优化设计 |
4.3.1 基于任务流水线思想的运行管理优化 |
4.3.2 内外存替换时的缓存排序优化 |
4.3.3 海量URL管理系统运行优化实验分析 |
4.4 本章小结 |
第5章 海量URL管理系统的设计与实现 |
5.1 引言 |
5.2 URL管理系统系统的设计目标 |
5.3 URL管理系统的体系结构和功能模块设计 |
5.3.1 URL管理系统的体系结构 |
5.3.2 URL管理系统功能模块详细设计 |
5.4 海量URL管理系统性能测试 |
5.4.1 开发平台及工具 |
5.4.2 海量URL管理系统运行性能实验 |
5.5 本章小结 |
结论 |
参考文献 |
致谢 |
(10)B+树的研究(论文提纲范文)
1、引言 |
2、FLP-树的定义 |
3、FLP-树与一般树的空间开销对比 |
4、FLP-树索引文件的结构 |
5、结论 |
四、全链接指针B~+树的研究(论文参考文献)
- [1]态势实时显示与回放系统的设计与实现[J]. 张明杰,王静平. 指挥控制与仿真, 2019(01)
- [2]面向序列数据分析的分布式存储与计算技术研究[D]. 牛德姣. 江苏大学, 2018(01)
- [3]一种基于B+树航迹态势回放系统的设计与实验[J]. 张明杰. 计算机应用与软件, 2018(08)
- [4]面向非易失性内存的系统软件若干问题的研究[D]. 刘昊. 上海交通大学, 2018(01)
- [5]数据库中一种分段混合时态索引的研究与实现[D]. 肖蒙. 东华大学, 2016(05)
- [6]一种基于Bigram二级哈希的中文索引结构[J]. 孙德才,王晓霞. 电子设计工程, 2014(12)
- [7]闪存碎片影响分析与闪存数据库索引技术研究[D]. 翟建东. 华中科技大学, 2011(07)
- [8]数据库效率比较研究及其在居民健康档案管理中的应用[D]. 李鸿泉. 南京理工大学, 2011(12)
- [9]基于B*树和B+树融合索引的海量URL管理技术[D]. 李春山. 哈尔滨工业大学, 2009(S2)
- [10]B+树的研究[J]. 刘玉喜,刘玉华. 中国科技财富, 2008(11)