2024年1月26日发(作者:)
1. 请用图框的方式大致地描绘出MySQL架构体系.
第一层: client Connector
ODBC、jdbc、api(C/JAVA/PERL/PYTHON/PHP)
第二层:MYSQL server 模块
thread connection pool/cache
sql interface(DDL/ DML/ TRIGGER/ VIEW /STORE PROCEDURE/ EVENT等)
sql parse & check privileges
sql optimize(explian)
server 统计/buffer:query cache
server admin manager command: backup restore security replicate 等
第三层:存储引擎
myisam/innodb/blackhole/archive/memory/merge/NDB
存储引擎是基于表
第四层:存储引擎相应的文件
logs file:binlog/err/general/ 层维护
myisam: frm/myi/myd
innodb: frm/ibd(index&data)/redo log/Undo log(5.7)
2. 限定MySQL5.5及以下为例,InnoDB存储引擎与MyISAM存储引擎的区别,至少写四点.
MYISAM(5.5.8前) INNODB
锁: 表锁 行锁
存储限制 256TB 64TB
文件类型 FRM/MYD/MYI FRM/ibdata
数据保存 堆表 索引组织表
外键 NO YES
事务: NO YES.4种隔离级别
MVCC(实现一致性非锁定读) NO YES
mvcc通过读取undo段内容生成的最新快照数据
# tablespace包含的内容
索引缓存 YES YES
数据缓存 NO YES
查询缓存 YES YES
# index
二级索引叶节点 行地址 行主键
B-tree index YES YES
T-tree index NO NO
Hash index NO NO,adaptive
fulltext index YES 5.6后支持
空间数据 YES YES
空间索引 YES NO
索引max长度(byte) 1000 768(1-2byte head)
memcache NO 5.6后支持
[在server层实现,并不是存储引擎实现的功能[/color]
压缩数据 支持(只读) 支持,但必须是Barracuda file format
加密数据 支持
同步 支持
备份
点恢复
[备份]
# 单表备份
myisam 可以直接拷贝frm/myd/myi文件即可
innodb 不能直接拷贝文件
[other]
表行数:innodb需要全部遍历/ MYISAM实时维护,不需要全表遍历。
auto_increment: 列上必须有索引,但innodb必须是第一列/myisam可以是任何一列
# innodb
-- 5.5 1.1
faster add/drop second index:copy data改为inplace
insert buffer(二级索引更新效率)
double write(写安全)
adaptive hash index(读效率)
aio(asynchronous io)提供磁盘读效率。
一次select扫描多次索引页(IO离散读),没扫描一次索引,需要等待完成才能开始下次扫描,而异步IO可以发出IO扫描指令后,不需要等待返回结果,立即发送下一个IO扫描指令,并行进行扫描
flush neighbor page(提供写效率,多个IO合为1个IO).ssd硬盘不需要开启
-- 5.6 1.2
memcache
fulltext
#myisam
单表最多2^63行
每个索引最多16个列
每个表最多64个索引
支持并发插入concurrent inserts
可以结合merge引擎,将多个表组合为1个表
3. MySQL中控制内存分配的全局参数,有哪些?(注:至少写6个以上)
binlog_cache_size:Global, 5.9之后只是针对事务语句的cache, 大事务需要增加此值
binlog_stmt_cache_size:Global,非事务语句cache, 5.9之后废弃
max_binlog_size:Global,binlog文件最大值
max_heap_size:Global
tmp_table_size:Global, Session7
using temporary table时,在session中设置此值,超过则memory改为disk myisam表
query_cache_size:Global
query_cache_limit:Global,查询结果超过此值则不进入缓存,防止大查询将cache清空
thread_cache_size:Global
bulk_insert_buffer_size:Global,Session
insert ... select ..; insert values (...),(...);load data infile
join_buffer_size:Global,Session
complex查询涉及多个表join时就需要使用多个join buffer
sort_buffer_size:Global,Session
table_definition_cache:Global
表多时,需要增加此值。太小会影响表打开速度,不占文件描述符
table_open_cache:Global,Session。占用文件描述符
1个表被N个线程使用,会被打开N次
1个表在当线程内也会被打开M次。select * from tb as t1,tb as t2;则tb被打开2次
如果打开表时cache满了,并且所有表都在使用,则cache会被临时扩展,当某个表可被回收时则释放临时扩展的空间
# myisam
MYD每个线程一个文件描述符,MYI所有线程公用一个文件描述符
[innodb]
innodb_buffer_pool_size:Global
innodb_additional_mem_pool_size:Global,申请的操作系统缓存,不占用buffer pool
innodb_log_buffer_size:Global
innodb_log_file_size:Global
[myisam]
key_buffer_size:Global
影响索引更新速度,越大越快?
read_buffer_size:Global,Session
对表做连续表数据扫描时使用
read_rnd_buffer_size:Global, Session
用key进行order,并且进行(非连续)扫描表数据时使用
4. 请简洁地描述下MySQL中InnoDB支持的四种事务隔离级别名称,以及逐级之间区别?
read uncommitted:未提交读。可以读取到其他线程修改(未提交)的数据
read committed:提交读。只能读取到其他线程已经提交的数据。解决脏读,修改的数据可能最后未提交。只锁定索引,并且不锁定索引前的间隙
repeatable read:可重复读。不能读取到其他线程提交的数据,间隙锁解决幻读。使用唯一索引进行等值查询,则只锁定索引,不锁定索取前间隙。其他查询,则不仅锁定索引,并且锁定索取范围包含的间隙
serializable:串行化读。所有的访问都串行化。将select转为select ... lock in share mode 即为查询语句涉及到的数据加上共享琐,阻塞其他事务修改真实数据。
5. 小题集锦
1>.VARCHAR(N) 或 CHAR(N)中的N含义是:
N个字符。1个字符不同字符集下占用的字节数不一样
2>.若一张表中只有一个字段VARCHAR(N)类型,utf8编码,则N最大值为多少(精确到数量级即可):
N=FLOOR((65535-1-2)/3)
3>.表中有大字段X(例如:text类型),且字段X不会经常更新,以读为为主,请问您
是选择拆成子表,还是继续放一起,并且写出您的 理由?
答案:拆为子表。
理由:提高其他字段的查询(select/update)效率,因为每页保存的行数越多,效率越高。
X字段更新效率低,
单行的读取效率降低不大,但如果每次查询的行数越多,影响越大
4>.MySQL中InnoDB引擎的行锁是通过加在什么上完成(或称实现)的:
A. 数据块
B. 索引值
选择答案后,告诉我们为什么?
答:索引值
索引值。innodb表数据是索引组织表形式存放
但是对索引页加锁,采用位图方式实现
锁:提供共享资源的并发访问,保证数据的完整性、一致性
sqlserver:2005前,页级锁;之后乐观并发,悲观并发。乐观并发支持行级锁
但和innodb实现方式不同,sql server下锁是稀有资源,某种情况下会升级为表锁
innodb、oracle:提供一致性的非锁定读、行级锁(没有相关额外开销)
通过索引查询时,主键锁的是key,辅助索引锁的是范围
锁的两个概念:latch、lock
latch:线程使用,轻量级锁,锁定内存数据结构
锁定时间必须很短。可再分为mutex(互斥锁)、rwlock(读写锁)。
目的是用来保证并发线程操作临界资源的正确性,
并且没有死锁检测,有mysql server保证
.Lock:事务使用,锁定的对象:表、页、行。commit或rollback后释放
意向锁:表级别的锁,表示下一行被请求的锁类型
locks rec but not gap: 表示锁住的是索引,而不是范围。有死锁检测。
5>.username字段定义为VARCHAR(40)和VARCHAR(200) 有啥区别?
答:临时表varchar(200)占用空间更大,最好按实际需求分配
6>.MySQL数据库备份方式有那几种(只讨论InnoDB存储引擎),至少写四种。
select ... into outfile;对应load data infile 恢复
fileds terminated by 'x';每个列的分隔符。默认't'
optionally encolsed by 'x';字符串的包含符。默认''
escaped by 'x':转义符,默认为''
starting by 'x';每行的开始符。默认''
terminated by 'x':每行结束符。默认'n'
mysqldump:对应mysql恢复
single-transaction:备份开始先执行start transaction
但不能有DDL操作,否则无法保证一致性读
master-data:如果没有指定single-transaction,则用lock-all-tables
1:显示master status,并且change master
2:只显示change,但不执行
mysqlimport:与load data infile类似,但支持导入多个表,表之间并发导入
二进制日志binlog备份
通过mysqlbinlog命令从binlog提取sql
xtrabackup
先记录当前redo位置
然后拷贝共享表空间和独立表空间数据
最后根据redo日志和开始位置,重做redo
快照备份LVM
6. MySQL复制搭建M->N的过程,请简述各个步骤?(备注:M已经在线跑,N为新安装的MySQL服务器)
1>在启动主从服务器时,必须用server_id启动选项给出其ID值。主从服务器的ID值不能相同。主服务器要启用二进制日志功能。在主、从服务器配置文件中:
主:server-id=master_server_id
Log-bin=binlog_name
从:server-id=slave_server_id
2>.在主服务器上,创建一个账户供从服务器连接主服务器并请求修改信息:
CREATE USER ‘slave_user’@’slave_host’ IDENTIFIED BY ‘slave_pass’;
CRANT REPLICATION SLAVE ON *.* TO 'slave_user'@'slave_host' ;
3>.连接到主服务器并通过执行 SHOW MASTER STATUS 语句确定当前的复制坐标。
4>.在从服务器上为将被复制的数据库建立一份完备的副本。
5>.连接到从服务器并使用CHANGE MASTER语句来配置它,包括把用来连接主服务器的参数和初始复制坐标告诉从服务器。
CHANGE MASTER TO
MASTER_HOST=’master_host’,
MSATER_USER=’master_user’,
MASTER_PASSWORD=’slave_pass’,
MASTER_LOG_FILE=’log_file_name’,
MASTER_LOG_POS=log_file_pos;
6>.让从服务器开始复制。START SLAVE;
7. 看图分析(申明:应用程序未有任何版本变更)
1>.图出现什么样的现象,及现象之间的关联性?
2>.通过图信息分析得出可能什么原因造成的?
3>.分析除原因后,告知如何解决?
4>.请简述你是如何思考分析的?
答:
8. SQL语句优化
原SQL语句:
SELECT
ID,WAYBILL_NO,EXP_TYPE,PKG_QTY,EXPRESS_CONTENT_CODE,EFFECTIVE_TYPE_CODE
FROM T_EXP_OP WHERE ORDERID NOT IN(SELECT ORDERID FROM T_EXP_OP WHERE
AUX_OP_CODE IN ('NEW','UPDATE','DELETE') AND ((OP_CODE IN (176, 162, 171, 131,
136)AND EXP_TYPE IN ('10', '20', '30')) OR (OP_CODE IN (191, 121)AND EXP_TYPE IN ('10',
'20')) OR (OP_CODE IN (181, 111)AND EXP_TYPE = '10'))) LIMIT 10;
条件:
T_EXP_OP表主键为BIGINT类型的ID字段,存储引擎为InnoDB,无其他索引
优化后为(提示:优化成一条简单的SQL语句,即无子查询,无JOIN关联):
SELECT
ID,
WAYBILL_NO,
EXP_TYPE,
PKG_QTY,
EXPRESS_CONTENT_CODE,
EFFECTIVE_TYPE_CODE
FROM
T_EXP_OP
WHERE
AUX_OP_CODE NOT IN ('NEW' , 'UPDATE', 'DELETE')
AND (OP_CODE NOT IN (176 , 162, 171, 131, 136, 191, 121, 181, 111)
AND EXP_TYPE NOT IN ('10' , '20', '30'))
LIMIT 10;
9. 分页SQL语句优化
原SQL语句:
SELECT * FROM test FORCE(idx_m_n) WHERE m=1 ORDER BY n LIMIT 1000,10;
条件:
Test表为InnoDB存储引擎,主键为BIGINT类型的ID字段,二级索引:idx_m_n(m,n)
优化后为:
索引改为: idx_mn(m,n,ID);
SELECT ID FROM test FORCE(idx_m_n) WHERE m=1 ORDER BY n LIMIT 1000,10;
SELECT * FROM test WHERE ID IN (ids);
请简述优化的理由:
10. 语句挑错
SQL语句:
SELECT name……,N.* columnname…..
FROM left_table M LEFT JOIN right_table N
ON M. columnname_join=N. columnname_join AND N. columnname=XXX AND
name=XXX
请问本SQL语句哪里不合理,为啥不合理?
答:
11. [SELECT *] 和[SELECT 全部字段]的2种写法有何优缺点,至少写出四点
a:代表 select *
b:代表 select 全部字段
1>.a需要解析数据字典,b不需要
2>.输出顺序:a与建表列顺序相同,b按指定字段顺序
如果字段调整顺序,a受影响,b不受影响
3>.表新增字段,浪费网络流量:a每次都返回所有字段,b只返回指定字段
4>.表字段改名:a不用改,b需要改
5>.b比a的可读性高
6>.b可以建索引优化,a无法优化
12. HAVNG 子句 和 WHERE的异同点,至少写出3点
1>.语法:where用表中列名,having用select结果别名
2>.影响结果范围: where 从表读出数据的行数,having返回客户端的行数
3>.索引:where可以使用索引,having不能使用索引,只能在临时结果集操作
13. 分布式数据库产品的特点(至少写4条)
1>.冗余,不存在单点故障,可靠性高
2>.数据分布在多个异地机房,容灾性好
3>.扩展简单
4>.不要求单机性能,但总体成本/管理成本都比较高
5>.受网络影响较大
14. 数据拆分架构 的优缺点(至少写8条)
1>.
2>.
3>.
4>.
5>.
6>.
7>.
8>.
9>.
本文发布于:2024-01-26 02:11:49,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/1706206309598.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |