同类图书

Similar books 换一批
  • 计算机基础知识及基本操作技能

    作者:杨桦, 肖祥林, 主编

    本书内容包括计算机基础知识、计算机系统的组成、操作系统的功能和使用、字表处理软件word的功能和使用、电子表格Excel的功能和使用、演示文稿PowerPoint、计算机网络基础知识、常用软件应用等。本书介绍的内容都是社会上最实用的技术,在原来Windows XP和Office 2003的基础上改版为windows 7操作系统和office 2010,体现了“在保证内容的完整性和科学性的前提下突出实用性”的原则。

  • PHOTOSHOP基础与图像创意案例

    作者:段光奎

    本书为分为基础篇和创意案例篇,其中基础篇为8章,分别为PHOTOSHOPCC基础知识、PHOTOSHOP选区工具、图像裁剪与图像变形、图层、渐变与油漆桶工具、绘图工具、修复工具、通道和蒙板的应用。创意案例篇分为露珠、证件照换底色、简洁新闻栏目网页设计、滚动扫描文字、编织效果人像、庆国庆火焰字、复古人像海报、浪漫情人节、照片调成金黄色、火焰骏马、非主流调色、图层变换应用、水晶球、冰雪字体、人像磨皮、中性灰精细修图、反转都市海报、梦幻瀑布、魔法师、创意海报。本书实用性强,可供计算机技术人员参考。

  • 藏文文本自动处理方法研究

    作者:珠杰

    随着藏文信息技术的快速发展,在探索藏文自然语言处理问题,如藏文字处理、词处理、短语处理和语句处理等领域取得了许多研究成果,但也存在很多尚未解决的问题。本书从目前需要亟待解决的几个关键问题出发,研究其解决方案和相应的实现算法,是藏文信息处理技术研究的相关成果的总结。全书共分3个部分,第1部分以藏文字处理为研究对象,讨论了藏文排序方法、藏文音节规则和自动拼写算法;第2部分以藏文词处理为研究对象,讨论了藏文停用词自动处理方法、藏文人名识别方法,研究了CRF和深度学习的藏文人名识别技术;第3部分以藏文自动校对为研究对象,讨论了基于音节规则的藏文拼写检查算法、藏文自动校对系统框架和接续关系检查算法。

图书分类

Book classification
  1. 本书分为两个部分,技术篇和实践应用篇。技术篇重点介绍大数据发展的特点和面临的挑战,讨论大数据智慧管理与分析技术——数据仓库和OLAP,介绍大数据、分布式、并行计算环境下,数据智慧管理技术的新发展——NoSQL数据库和NewSQL数据仓库,阐述了这两大类新技术的基本数据模型、系统架构和性能优势。实践应用篇分别从关系数据仓库建设与OLAP分析、基于Hive的数据仓库技术与OLAP应用、HBase大数据...查看更多
  2. 前  言
    1. 编写的背景
    首先,基于大数据的互联网电子商务、智能交通系统、大数据金融、智慧城市等渗透进我们生活的各个层面,已经从“概念”走向了“价值”和“应用”。为了理解、分析和研究大数据,有效地掌握和应用大数据关键技术,撰写一本讨论大数据智慧管理和分析的核心概念、技术要领、技术关联和实现机制的书是迫切需要的。
    其次,人们希望学习和掌握如何在近真实的应用环境中运用关键技术,如何建设大数据管理与分析环境,研发大数据基础系统,从而从理论和实践两个方面更好地理解和使用大数据技术。从而能有效地解决实践中的问题,推动应用领域快速向前发展。因此,一本涵盖这些内容的书是喜闻乐见的。
    最后,大数据覆盖了结构化、半结构化和非结构化数据类型,发展出了5V、6V甚至是7V特点。大数据技术从关系型数据库和数据仓库技术发展到现在的非关系数据管理技术,如NoSQL和NewSQL。新发展的NoSQL和NewSQL技术与关系数据管理与海量数据仓库技术有着相辅相成、继承再发展的关系。沿着这条“继承再发展”脉络讨论大数据智慧管理和分析是新颖的和十分必要的。
    2. 本书的特点
    编著本书历时4年,具有较大的挑战性:
    其一,大数据技术的发展十分迅速,新的技术、技术组合和应用领域不断涌现,现有的技术不断更新和完善。著作内容应体现技术的发展和新颖性。
    其二,大数据智慧管理和分析技术不仅继承了成熟丰富的结构化数据管理技术的优势,还继承了海量数据智慧管理与分析计算(数据仓库)的技术优势和先进思路,而且正站在这些“巨人”的肩膀上,逐步发展出能应对大数据新特点、新挑战、较全面和完善的技术体系。整个技术体系、架构和机制具有相当的深度和广度。因此,著作内容应具有继承性。
    其三,大数据与互联网、分布式架构、数据分析、故障恢复等技术紧密相关,技术间相互作用,技术集成产出功能十分复杂。因此,著作内容应涵盖技术的关联性。
    其四,要理解、掌握和运用大数据智慧管理与分析技术,理论联系实际是关键途径。但目前阐述这些技术及其在应用中如何发挥作用的相关内容还较零散,不够具体和全面。因此,著作内容必须具有实践性。
    作者力图通过翔实的内容、清晰的层次、重点突出的阐述、丰富的案例讨论、形象生动的图表,以及具体的应用实例来解释枯燥的技术原理,从而达到使读者易读、易懂、易使用的目标。
    3. 要点、作用与适用面
    作者在查阅、分析和研究文献资料的基础上,介绍了大数据智慧管理与分析技术的历史沿革和最新发展;总结了大数据的5V特点和技术挑战;重点讨论了大数据智慧管理与分析技术对关系数据模型、海量数据仓库机制与OLAP分析技术的继承与发展。本书聚焦数据仓库、Hive和HBase三大技术,重点阐述了基本概念、数据模型、技术原理、实现平台环境;厘清并归纳总结了相关核心技术;分析了技术特点、技术之间的重要关联和技术集成的优势;深入讨论了三大技术在实践应用中的实现;针对海量数据管理、NoSQL和NewSQL实践项目开发给予详细、有效、可行的指导。本书示范了如何应用数据仓库、Hive和HBase三大技术完成不同的实践应用的全过程,从而突出了理论与实践相结合的特点。
    希望读者通过阅读本书,能了解数据仓库、NewSQL、NoSQL技术的发展和技术特点;能学习掌握数据仓库机制/OLAP分析、Hive和HBase等大数据管理和智慧分析的技术原理、功能、架构和实践应用;厘清各个关键技术的相互关系、优势与不足,了解技术集成与所解决的问题。特别是能在本书的指导下,掌握开发基于Hive和HBase大数据管理和分析的应用,提高数据管理、分析和应用的能力。
    本书既可面向具有计算机科学、数据科学、IT专业知识的技术人员、研发者和学习大数据知识与技术的研究生与本科学生,作为他们学习掌握大数据智慧管理和分析技术、践行理论联系实际的参考用书或教材;也适用于从事大数据工作的非专业领域人士,包括经济分析、交通大数据管理与分析、医疗健康大数据管理及分析等领域。本书给出了完整的应用示例作为技术运用的参考,为上述人士,特别是非专业技术人员提供了较好的帮助。
    作者采用全英语讲授的“数据仓库与数据挖掘”是一门备受学生欢迎的课程,是正在开展的“计算机科学与技术全英文研究生专业建设”的重要课程之一。大数据管理与分析也是本科教学内容的深化,是许多教学改革项目的支撑。作者通过10多年相关的科学研究、项目研发和教学,以及对学生进行硕士论文和课内外实践项目的指导,对大数据管理与分析有了较深的领悟,同时积累了知识和经验,践行了关键技术和项目的开发,从而为编著本书创造了很好的条件。
    4. 本书的主要内容
    本书由两大部分组成,第一部分是技术篇,重点介绍大数据发展的特点和面临的挑战,讨论了经典的海量数据智慧管理与分析技术—— 数据仓库和OLAP;介绍了大数据、分布式、并行计算环境下,数据智慧管理技术的新发展—— NoSQL数据库和NewSQL数据仓库;重点阐述了这两大新技术的基本数据模型、系统架构和性能优势;重点对比了OldSQL(经典关系数据模型)与NoSQL数据库(HBase)、关系数据仓库与NewSQL数据仓库(Hive)的技术异同和优劣势;讨论了这些技术的组合集成方案、组合技术的优势以及实际应用案例。第二部分是实践应用篇,分别从关系数据仓库建设与OLAP分析、基于Hive的数据仓库技术与OLAP应用、HBase大数据管理技术实践三个方面进行了详细阐述;根据相关技术原理和应用需求,详细讨论了基于Hadoop的环境配置、大数据管理模型建立与实现;着重给出了应用三大关键技术构建大数据智慧管理与分析系统、开发实践项目的指导内容。全书采取由概念到技术、理论到实践的顺序编写。
    第一部分技术篇:
    第1章介绍了大数据的发展与影响,以及5V特点,简要讨论了大数据的应用,分析了对大数据技术的误解,简要阐述了大数据形态与关系数据模型在基本原理和管理机制上的异同。
    第2章介绍了大数据的生命周期,分析了大数据面临的技术挑战和应对挑战的策略与方法。
    第3章分析讨论了关系数据模型在大数据管理的局限性,阐述了面向大数据特点的技术革新,讨论了NoSQL 中几个关键技术的原理和特点。
    第4章重点介绍列式数据管理技术,讨论了HBase的数据模型和集群架构等,分析了HBase的作用与局限。
    第5章首先讨论了数据仓库建模与OLAP分析技术,由此引出NewSQL数据仓库—— Hive技术。重点讨论了Hive的数据模型和系统结构,基于Hive的OLAP功能,分析了Hive与其他技术的比较与集成。
    第6章阐述了新老技术的继承与发展关系,讨论了技术组合的作用,分析了相关案例。
    第二部分实践应用篇:
    第7章重点讨论了面向大数据的数据仓库建模和实现,示范了一个基于ROALP数据仓库技术的海量数据管理应用与基于OLAP技术的数据分析。
    第8章重点讨论了Hive技术及其实践项目开发。针对大数据5V特点,设计与实现了一个基于Hive数据仓库技术的大数据管理与分析示范系统。该系统包括基于Hadoop平台的应用环境搭建、参数设置、基于HQL的OLAP分析计算,以及分析结果可视化展示。
    第9章着力于讨论NoSQL 家族中的HBase技术如何与实践相结合,设计与实现了一个基于HBase列式数据库技术的大数据管理示范系统。该系统包括分布式Hadoop平台的搭建和组件配置、HBase数据库设计与实现、数据访问功能与结果可视化展示。
    5. 致  谢
    本书的编写工作得到了四川省科技计划项目(No. 2019YFSY0032)的支持。西南交通大学“扬华学者”计划和研究生院对作者的教学改革与实践给予了大力支持,从而促成了本书的编著。再者,衷心感谢西南交通大学出版社对本书的出版所给予的帮助。
    作者在繁重的教学、科研和学生指导培养工作中,能完成本书的编著,离不开亲人们的照顾、扶持和帮助,在此向亲人们表达深深的谢意。
    全书由朱焱编著。陶霄、颜仕雄、杜强、张人之、何欢实现并优化了第二部分实践应用篇中的示范性实例系统。限于作者的水平和时间,书中难免存在不当之处,恳请读者及专家批评指正。


    朱  焱       
    2019年6月于成都
    ...查看更多
  1. 技术篇
    基于NoSQL和NewSQL新技术的大数据管理与分析
    第1章  大数据及其特点 3
    1.1  大数据时代当前的状态 3
    1.2  大数据定义与特点 5
    1.3  沃尔玛应用大数据的案例 7
    1.4  其他应用实例 8
    1.5  对大数据的误解 9
    1.6  CAP理论与BASE 12
    第2章  大数据生命周期及相应的技术挑战 15
    2.1  大数据生命周期 15
    2.2  大数据面临的技术挑战 16
    2.3  大数据安全与应用的挑战 19
    2.4  针对大数据挑战的应对策略与技术方法 21
    第3章  从关系数据管理到NoSQL技术的变革 35
    3.1  关系数据库核心特点简介 35
    3.2  关系数据模型在大数据处理方面的局限 36
    3.3  面向大数据特点的数据管理技术革新 38

    第4章  列式数据管理技术—— HBase数据库 51
    4.1  HBase概述 51
    4.2  HBase数据模型 52
    4.3  HBase集群配置 55
    4.4  HBase各个组件之间的关系 57
    4.5  HBase的索引数据结构—— LSM树 58
    4.6  HBase的作用和局限 60
    4.7  HBase与其他相关技术的比较 62
    4.8  应用实例 64
    第5章  从关系型数据仓库发展到NewSQL的Hive技术 67
    5.1  数据仓库技术介绍 67
    5.2  数据仓库的定义和特点 69
    5.3  数据库与数据仓库技术不能合二为一的原因 70
    5.4  数据仓库建模 71
    5.5  OLAP分析 76
    5.6  Hive数据仓库技术 83
    5.7  Apache Kylin—— Hadoop生态圈的MOLAP机制 93
    5.8  Hive的适用场景 96
    5.9  Hive与HBase的比较 96
    5.10  Hive 和关系数据仓库的异同 98
    5.11  Hive和HBase—— 联合起来作用更强大 100
    第6章  大数据智慧管理技术的组合应用 103
    6.1  关系数据库与NoSQL的组合 103
    6.2  NoSQL与NewSQL的联合 105
    6.3  应用组合技术的公司示例(见表6.1) 107
    大数据智慧管理与分析之实践指南 109

    实践应用篇
    大数据智慧管理与分析之实践指南
    第7章  数据仓库建设与OLAP分析实践 111
    7.1  数据仓库实例背景 111
    7.2  数据仓库的数据预处理 112
    7.3  数据仓库建模 115
    7.4  常用OLAP分析操作 117
    7.5  MDX—— OLAP分析查询语言 118
    7.6  销售数据仓库建设实践项目 121
    7.7  基于B/S的初级数据仓库实践项目开发 141
    第8章  Hive数据仓库开发和OLAP分析实践 151
    8.1  Hive数据仓库适用领域 151
    8.2  开发基于Hive的数据仓库 151
    8.3  基于Hive数据仓库的OLAP分析 170
    第9章  基于HBase的大数据管理系统 开发与维护实践 191
    9.1  HBase的适用场景 191
    9.2  进口货物记录HBase系统设计 192
    9.3  基于Web浏览器的HBase数据访问可视化 204
    附件1  ASCII码表(基本表) 211
    附件2  过滤器列表 214
    附件3  HBase实践项目可视化部分的参考代码 215
    ...查看更多
  2. 朱焱,德国达姆斯塔特工业大学(TU Darmstadt)工学博士,西南交通大学信息科学与技术学院教授,四川省学术和技术带头人后备人选;研究方向为大数据智慧管理、大数据智能分析、数据挖掘

评论

0/500