初窥InnoDB的Memcached插件及应用
作者:课课家更新于:
2015-11-02 11:23:10
在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!!
前些年,HandlerSocket的横空出世让人们眼前一亮,当时我还写了一篇文章介 绍了其用法梗概,时至今日,由于种种原因,HandlerSocket并没有真正流行起来,不过庆幸的是MySQL官方受其启发,研发了基于InnoDB 的Memcached插件,总算是在MySQL中延续了NoSQL的香火,以前单独架设Memcached服务器不仅浪费了内存,而且还必须自己维护数据 的不一致问题,有了Memcached插件,这些问题都不存在了,而且借助MySQL本身的复制功能,我们可以说是变相的实现了Memcached的复 制,这更是意外之喜。
安装
为了让文章更具完整性,我们选择从源代码安装MySQL,需要注意的是早期的版本有内存泄漏,所以推荐安装最新的稳定版,截至本文发稿时为止,最新的稳定版是5.6.13,我们就以此为例来说明,过程很简单,只要激活了WITH_INNODB_MEMCACHED即可:
- shell> groupadd mysql
- shell> useradd -r -g mysql mysql
- shell> tar zxvf mysql-5.6.13.tar.gz
- shell> cd mysql-5.6.13
- shell> cmake . -DWITH_INNODB_MEMCACHED=ON
- shell> make
- shell> make install oracle教程
- shell> cd /usr/local/mysql
- shell> chown -R mysql .
- shell> chgrp -R mysql .
- shell> scripts/mysql_install_db --user=mysql
- shell> chown -R root .
- shell> chown -R mysql data
- shell> bin/mysqld_safe --user=mysql &
- shell> cp support-files/mysql.server /etc/init.d/mysql.server
MySQL安装完毕后,在插件目录我们能看到innodb_engine.so和libmemcached.so:
- mysql> SELECT @@plugin_dir;
- +------------------------------+
- | @@plugin_dir |
- +------------------------------+
- | /usr/local/mysql/lib/plugin/ |
- +------------------------------+
此外还需要导入Memcached插件所需要的表结构:
- mysql> SOURCE /usr/local/mysql/share/innodb_memcached_config.sql
一切就绪后就可以激活Memcached插件了(当然如果需要的话也可以禁止):
- mysql> INSTALL PLUGIN daemon_memcached soname "libmemcached.so";
- mysql> UNINSTALL PLUGIN daemon_memcached;
说明:如果要重启插件的话,可以先uninstall,再install。
Memcached插件相关的配置信息如下,具体介绍可以参考官方文档:
oracle视频教程
- mysql> SHOW VARIALES LIKE '%memcached%';
- +----------------------------------+------------------+
- | Variable_name | Value |
- +----------------------------------+------------------+
- | daemon_memcached_enable_binlog | OFF |
- | daemon_memcached_engine_lib_name | innodb_engine.so |
- | daemon_memcached_engine_lib_path | |
- | daemon_memcached_option | |
- | daemon_memcached_r_batch_size | 1 |
- | daemon_memcached_w_batch_size | 1 |
- +----------------------------------+------------------+
注意:daemon_memcached_r_batch_size和daemon_memcached_w_batch_size,这两个选项对性能影响较大,简单点说就是控制事务提交的频率,MySQL的缺省值均为1,也就是说每次都提交,这主要是从安全性考虑的,大家可以依照自己的情况来调整。
差不多了,此时Memcached端口应该准备就绪了,你可以试试看:
经李克强总理签批,2015年9月,国务院印发《促进大数据发展行动纲要》(以下简称《纲要》),系统部署大数据发展工作。
《纲要》明确,推动大数据发展和应用,在未来5至10年打造精准治理、多方协作的社会治理新模式,建立运行平稳、安全高效的经济运行新机制,构建以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能、新兴繁荣的产业发展新生态。
《纲要》部署三方面主要任务。一要加快政府数据开放共享,推动资源整合,提升治理能力。大力推动政府部门数据共享,稳步推动公共数据资源开放,统筹规划大数据基础设施建设,支持宏观调控科学化,推动政府治理精准化,推进商事服务便捷化,促进安全保障高效化,加快民生服务普惠化。二要推动产业创新发展,培育新兴业态,助力经济转型。发展大数据在工业、新兴产业、农业农村等行业领域应用,推动大数据发展与科研创新有机结合,推进基础研究和核心技术攻关,形成大数据产品体系,完善大数据产业链。三要强化安全保障,提高管理水平,促进健康发展。健全大数据安全保障体系,强化安全支撑。[11]
2015年9月18日贵州省启动我国首个大数据综合试验区的建设工作,力争通过3至5年的努力,将贵州大数据综合试验区建设成为全国数据汇聚应用新高地、综合治理示范区、产业发展聚集区、创业创新首选地、政策创新先行区。
围绕这一目标,贵州省将重点构建“三大体系”,重点打造“七大平台”,实施“十大工程”。
“三大体系”是指构建先行先试的政策法规体系、跨界融合的产业生态体系、防控一体的安全保障体系;“七大平台”则是指打造大数据示范平台、大数据集聚平台、大数据应用平台、大数据交易平台、大数据金融服务平台、大数据交流合作平台和大数据创业创新平台;“十大工程”即实施数据资源汇聚工程、政府数据共享开放工程、综合治理示范提升工程、大数据便民惠民工程、大数据三大业态培育工程、传统产业改造升级工程、信息基础设施提升工程、人才培养引进工程、大数据安全保障工程和大数据区域试点统筹发展工程。
此外,贵州省将计划通过综合试验区建设,探索大数据应用的创新模式,培育大数据交易新的做法,开展数据交易的市场试点,鼓励产业链上下游之间的数据交换,规范数据资源的交易行为,促进形成新的业态。
国家发展改革委有关专家表示,大数据综合试验区建设不是简单的建产业园、建数据中心、建云平台等,而是要充分依托已有的设施资源,把现有的利用好,把新建的规划好,避免造成空间资源的浪费和损失。探索大数据应用新的模式,围绕有数据、用数据、管数据,开展先行先试,更好地服务国家大数据发展战略。
- shell> echo "stats" | nc localhost 11211
换句话说,MySQL已经兼容Memcached协议,可以直接使用Memcached命令。
配置
在安装步骤里,我们导入了一个名为innodb_memcached_config.sql的脚本,它创建了一库(innodb_memcache)三表(cache_policies, config_options, containers):
- mysql> USE innodb_memcache
- mysql> SHOW TABLES;
- +---------------------------+
- | Tables_in_innodb_memcache |
- +---------------------------+
- | cache_policies |
- | config_options |
- | containers |
- +---------------------------+
cache_policies定义了缓存策略,包含如下选择:
- innodb_only:只使用InnoDB作为数据存储。
- cache-only:只使用传统的Memcached引擎作为后端存储。
- caching:二者皆使用,如果在Memcached里找不到,就查询InnoDB。
config_options定义了分隔符号:
- separator:Memcached只识别单值,使用此分隔符(|)来连接多个字段的值。
- table_map_delimiter:通过此分隔符(.)来确认表和键,如:@@table.key。
如果我们想通过Memcached协议来访问一个表,需要先在containers中配置它:
- mysql> SELECT * FROM containers\\\\G
- *************************** 1. row ***************************
- name: aaa
- db_schema: test
- db_table: demo_test
- key_columns: c1
- value_columns: c2
- flags: c3
- cas_column: c4
- expire_time_column: c5
- unique_idx_name_on_key: PRIMARY
如上已经有了test数据库的demo_test表,通过c1查询c2的值,表结构如下所示:
oracle数据库教程
- mysql> DESC test.demo_test;
- +-------+---------------------+------+-----+---------+-------+
- | Field | Type | Null | Key | Default | Extra |
- +-------+---------------------+------+-----+---------+-------+
- | c1 | varchar(32) | NO | PRI | | |
- | c2 | varchar(1024) | YES | | NULL | |
- | c3 | int(11) | YES | | NULL | |
- | c4 | bigint(20) unsigned | YES | | NULL | |
- | c5 | int(11) | YES | | NULL | |
- +-------+---------------------+------+-----+---------+-------+
缺省情况下有一行数据:
- mysql> SELECT * FROM test.demo_test;
- +----+--------------+------+------+------+
- | c1 | c2 | c3 | c4 | c5 |
- +----+--------------+------+------+------+
- | AA | HELLO, HELLO | 8 | 0 | 0 |
- +----+--------------+------+------+------+
让我们用Memcached协议来访问看看:
- shell> echo "get @@aaa.AA" | nc localhost 11211
- VALUE @@aaa.AA 8 12
- HELLO, HELLO
- END
我们还可以先设定缺省访问的表,然后后续的查询就只写键名就可以了:
- shell> (echo "get @@aaa"; echo "get AA") | nc localhost 11211
- VALUE @@aaa 0 14
- test/demo_test
- END
- VALUE AA 8 12
- HELLO, HELLO
- END
虽然我的例子都是通过命令行执行的,但是大家很容易就更改写成PHP之类的方法。
限制
Memcached插件用起来非常简单,不过并不是一切都很完美,比如说:当我们配置表的时候,containers表的字段,除了 key_columns和value_columns以外,其它的字段,如:flags,cas_column,expire_time_column等 也必须设定,可是很多时候,我们在原表中找不到贴切的字段,此时就只能对应新建三个字段,味道很恶心。
此外,containers表还有如下限制:
- key_columns字段的类型必须是CHAR或VARCHAR,且最大长度是250个字符。
- value_columns字段的类型必须是CHAR或VARCHAR或BLOB,长度不限。
- cas_column字段的类型必须是BIGINT。
- expiration_time_column字段的类型必须是INT。
- flags字段的类型必须是INT。
说明:随着MySQL版本的更新,这些限制可能会发生变化,请大家以实际情况为准。
实战
让我们以一个用户登录的例子来检验一下学习成果:
首先在测试数据库创建一个用户表:
- USE `test`
-
- CREATE TABLE `users` (
- `id` INT(10) UNSIGNED NOT NULL AUTO_INCREMENT,
- `username` VARCHAR(15) NOT NULL,
- `passWord` VARCHAR(32) NOT NULL,
- `email` VARCHAR(50) NOT NULL,
- `flags` INT(10) UNSIGNED DEFAULT '0',
- `cas_column` BIGINT(20) UNSIGNED DEFAULT '0',
- `expire_time_column` INT(10) UNSIGNED DEFAULT '0',
- PRIMARY KEY (`id`),
- UNIQUE KEY `username` (`username`)
- ) ENGINE=InnoDB;
然后添加几行测试数据:
- INSERT INTO `users` (`username`, `password`, `email`)
- VALUES
- ('foo', 'ffffffffffffffffffffffffffffffff', 'foo@domain.com'),
- ('bar', 'bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb', 'bar@domain.com');
接着在containers里配置这个表:
- INSERT INTO innodb_memcache.containers (
- name, db_schema, db_table, key_columns, value_columns,
- flags, cas_column, expire_time_column, unique_idx_name_on_key
- ) VALUES (
- 'default', 'test', 'users', 'username', 'password|email',
- 'flags', 'cas_column', 'expire_time_column', 'username' oracle视频
- );
这里我们定义了多个字段(password和email)作为value_columns,并且使用竖线作为分隔符,实际上使用空格,逗号之类分隔符也可以,在innodb_config.c文件的源代码中能查到如下关于分隔符的定义,文档里并没有涵盖这些信息:
- static const char* sep = " ;,|\\\\n";
最后使用Memcached协议来访问一下,这里我们换个花样,执行一个MGET操作:
- shell> echo "get foo bar" | nc localhost 11211
- VALUE foo 0 47
- ffffffffffffffffffffffffffffffff|foo@domain.com
- VALUE bar 0 47
- bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb|bar@domain.com
- END
既然我定义value_columns的时候设置了多个字段,那么返回数据的时候自然也返回多个字段的数据,并且它们依照 innodb_memcache.config_options表中的separator字段来分隔,缺省情况下是一个竖线,如果你的字段内容里包含了竖 线,那么就会和缺省值发生冲突,此时你可以更新separator的定义,比如改成三个竖线等等,需要提醒的是,修改后别忘了重启Memcached插 件。
说明:因为们在配置的时候把表命名为default,所以在请求的时候不用传递表名。如果不存在default,那么会把名字按照字母顺序正序排列,排在第一位的就是缺省。
…
本文在使用Memcached插件的时候,所有例子均使用的是读操作,实际上写操作也是支持的,不过在实际使用时,我更倾向于写操作都通过SQL来 执行,而Memcached插件仅处理KV形式的读操作,实际压力测试的结果显示,Memcached插件比SQL的方式,性能提升了百分之一百左右,虽 然仍不及独立的Memcached,但考虑到其它的优势,这个结果已经很让人欣喜了,下一站,InnoDB的Memcached插件!大家做好准备吧。
更多视频课程文章的课程,可到课课家官网查看。我在等你哟!!!