目录

Python学习之路-MongoDB基础与简单使用

NoSQL的介绍

“NoSQL”⼀词最早于1998年被⽤于⼀个轻量级的关系数据库的名字。随着web2.0的快速发展, NoSQL概念在2009年被提了出来,NoSQL在2010年⻛⽣⽔起, 现在国内外众多⼤⼩⽹站, 如facebook、 google、 淘宝、 京东、 百度等, 都在使⽤NoSQL开发⾼性能的产品。对于⼀名程序员来讲, 使⽤nosql已经成为⼀条必备技能。NoSQL最常⻅的解释是“non-relational”, “Not Only SQL”也被很多⼈接受, 指的是⾮关系型的数据库

关系型和非关系型的介绍

对于关系型数据库,存储数据的时候需要提前建表建库,随着数据的复杂度越来越高,所建的表的数量也越来越多;但是非关系型却不需要

MongoDB的优势

  • 易扩展: NoSQL数据库种类繁多, 但是⼀个共同的特点都是去掉关系数据库的关系型特性。 数据之间⽆关系, 这样就⾮常容易扩展
  • ⼤数据量, ⾼性能: NoSQL数据库都具有⾮常⾼的读写性能, 尤其在⼤数据量下, 同样表现优秀。 这得益于它的⽆关系性, 数据库的结构简单
  • 灵活的数据模型: NoSQL⽆需事先为要存储的数据建⽴字段, 随时可以存储⾃定义的数据格式。 ⽽在关系数据库⾥, 增删字段是⼀件⾮常麻烦的事情。 如果是⾮常⼤数据量的表, 增加字段简直就是⼀个噩梦

MongoDB的安装

命令安装

1
2
3
sudo apt-get install -y mongodb-org

https://docs.mongodb.com/manual/tutorial/install-mongodb-on-ubuntu/

源码安装

  • 解压

    1
    
    tar -zxvf mongodb-linux-x86_64-ubuntu1604-3.4.0.tgz
    
  • 移动到/usr/local/目录下

    1
    
    sudo mv -r mongodb-linux-x86_64-ubuntu1604-3.4.0/ /usr/local/mongodb
    
  • 将可执行文件添加到PATH路径中

    1
    
    export PATH=/usr/local/mongodb/bin:$PATH
    

启动MongoDB

服务端MongoDB的启动

  • 查看帮助:mongod –help
  • 启动:sudo service mongod start
  • 停止:sudo service mongod stop
  • 重启:sudo service mongod restart
  • 查看是否启动成功:ps -ef|grep mongod
  • 配置文件的位置:/etc/mongod.conf,
  • 默认端⼝:27017
  • 日志的位置:/var/log/mongodb/mongod.log

客户端MongoDB

  • 启动本地客户端:mongo
  • 查看帮助:mongo –help
  • 退出:exit或者ctrl+c

服务端MongoDB无法启动的解决方法

1
sudo mongod --config /etc/mongod.conf &

MongoDB的官方文档

位置:https://docs.mongodb.com/manual/introduction/

MongoDB的基本使用

MongoDB数据库的命令

  • 查看当前的数据库:db
  • 查看所有的数据库:show dbs /show databases
  • 切换数据库:use db_name
  • 删除当前的数据库:db.dropDatabase()

MongoDB集合的命令

  • 不手动创建集合: 向不存在的集合中第⼀次加⼊数据时, 集合会被创建出来
  • 手动创建结合:
    • db.createCollection(name,options)
    • db.createCollection(“stu”)
    • db.createCollection(“sub”, { capped : true, size : 10 } )
    • 参数capped: 默认值为false表示不设置上限,值为true表示设置上限
    • 参数size: 当capped值为true时, 需要指定此参数, 表示上限⼤⼩,当⽂档达到上限时, 会将之前的数据覆盖, 单位为字节
  • 查看集合:show collections
  • 删除集合:db.集合名称.drop()

MongoDB中常见的数据类型

常见类型

  • Object ID: ⽂档ID
  • String: 字符串, 最常⽤, 必须是有效的UTF-8
  • Boolean: 存储⼀个布尔值, true或false
  • Integer: 整数可以是32位或64位, 这取决于服务器
  • Double: 存储浮点值
  • Arrays: 数组或列表, 多个值存储到⼀个键
  • Object: ⽤于嵌⼊式的⽂档, 即⼀个值为⼀个⽂档
  • Null: 存储Null值
  • Timestamp: 时间戳, 表示从1970-1-1到现在的总秒数
  • Date: 存储当前⽇期或时间的UNIX时间格式

注意点

  • 创建⽇期语句如下 :参数的格式为YYYY-MM-DD new Date(‘2017-12-20’)

  • 每个⽂档都有⼀个属性, 为_id, 保证每个⽂档的唯⼀性

    可以⾃⼰去设置_id插⼊⽂档,如果没有提供, 那么MongoDB为每个⽂档提供了⼀个独特的_id, 类型为objectID

  • objectID是⼀个12字节的⼗六进制数,每个字节两位,一共是24 位的字符串: 前4个字节为当前时间戳 接下来3个字节的机器ID 接下来的2个字节中MongoDB的服务进程id 最后3个字节是简单的增量值

MongoDB的增删改查

MongoDB的插入

命令:db.集合名称.insert(document)

1
2
  db.stu.insert({name:'gj',gender:1})
  db.stu.insert({_id:"20170101",name:'gj',gender:1})

插⼊⽂档时, 如果不指定_id参数, MongoDB会为⽂档分配⼀个唯⼀的ObjectId

MongoDB的保存

命令:db.集合名称.save(document) 如果⽂档的_id已经存在则修改, 如果⽂档的_id不存在则添加

MongoDB的简单查询

命令:db.集合名称.find()

MongoDB的更新

命令:db.集合名称.update(<query> ,<update>,{multi: <boolean>})

  • 参数query:查询条件
  • 参数update:更新操作符
  • 参数multi:可选, 默认是false,表示只更新找到的第⼀条记录, 值为true表示把满⾜条件的⽂档全部更新
1
2
3
db.stu.update({name:'hr'},{name:'mnc'})   更新一条
db.stu.update({name:'hr'},{$set:{name:'hys'}})    更新一条
db.stu.update({},{$set:{gender:0}},{multi:true})   更新全部

注意:“multi update only works with $ operators”

MongoDB的删除

命令:db.集合名称.remove(<query>,{justOne: <boolean>})

  • 参数query:可选,删除的⽂档的条件
  • 参数justOne:可选, 如果设为true或1, 则只删除⼀条, 默认false, 表示删除多条

MongoDB的高级查询

数据查询

  • ⽅法find(): 查询

    db.集合名称.find({条件⽂档})

  • ⽅法findOne():查询,只返回第⼀个

    db.集合名称.findOne({条件⽂档})

  • ⽅法pretty(): 将结果格式化

    db.集合名称.find({条件⽂档}).pretty()

比较运算符

  • 等于: 默认是等于判断, 没有运算符
  • ⼩于:$lt (less than)
  • ⼩于等于:$lte (less than equal)
  • ⼤于:$gt (greater than)
  • ⼤于等于:$gte
  • 不等于:$ne

逻辑运算符

逻辑运算符主要指与、或逻辑

  • and:在json中写多个条件即可
  • or:使⽤$or, 值为数组, 数组中每个元素为json

范围运算符

使⽤$in$nin 判断数据是否在某个数组内

⽀持正则表达式

使⽤//或$regex编写正则表达式

skip和limit

  • ⽅法limit(): ⽤于读取指定数量的⽂档

  • ⽅法skip(): ⽤于跳过指定数量的⽂档

注意:先使用skip在使用limit的效率要高于前者

自定义查询

由于mongo的shell是一个js的执行环境 使⽤$where后⾯写⼀个函数, 返回满⾜条件的数据

投影

在查询到的返回结果中, 只选择必要的字段

命令:db.集合名称.find({},{字段名称:1,...})

参数为字段与值, 值为1表示显示, 值为0不显 特别注意: 对于_id列默认是显示的, 如果不显示需要明确设置为0

排序

⽅法sort(), ⽤于对 集进⾏排序

命令:db.集合名称.find().sort({字段:1,...})

参数1为升序排列 参数-1为降序排列

统计个数

⽅法count()⽤于统计结果集中⽂档条数

命令:db.集合名称.find({条件}).count() 命令:db.集合名称.count({条件})

消除重复

⽅法distinct()对数据进⾏去重

命令:db.集合名称.distinct('去重字段',{条件})