Mysql业务优化与设计

一、基于性能的表设计

二、反范式，冗余必要字段

针对核心sql保留查询结果所必须的冗余字段，避免频繁JOIN操作；（根据范式要求设计的表字段，在实际查询时可能要查找到两个表才能找到，我们所要的结果，这样查两个表的代价比较高，所以有时可以做必要的更改，把核心SQL要用的结果放到一个表中。还有就是自动递增字段做为主键也是范式冗余的，不过这样做可以减少insert时间；表中增加更新时间字段使用timestamp类型，可以有助于日后的维护操作。）

三、拆分大字段

拆分大字段到单独的表中，避免范围扫描代价增大。如：将博文表拆分成两份。一份包含博文ID、主题、时间等信息，另一份包含博文ID和正文。因为人们在看博客时会先看标题信息，只对感兴趣的文章才会点进去看，都在一个表里的话，每次查询都要读出所有内容，I/O代价太高。

四、避免过多字段或过长行

五、分页查询

(1)避免limit+offset过大

因为offset过大的话，数据库还是会实际扫描过offset条记录，因为数据库的优化关键点就是降低数据扫描量，所以这样的做法不可取。
取而代之的是使用自增主键ID模拟分页：（1）第一页直接查（2）获取第一页最后一行的ID值max(id)（3）第二页用where id > “max(id)” limit 100。这样每页的扫描代价是一样的，不会发生越向后扫描记录越多的IO代价。

（2）要求业务上禁止查询xx页之后的数据。

六、统计的实现方式

（1）触发器实时统计

最精准的统计方式，但会影响插入性能。

（2）最大自增ID实现统计

最容易实现并性能最佳，但中间不能有删除的记录。

（3）伪实时统计

在表中加入更新时间字段，每隔一段时间统计一次增量是多少，每次都根据上次更新的时间点，把最近更新的记录数加到一个统计表中。这样就实现了一个伪实时统计策略，而不会因为全表扫描影响数据库性能。

（4）利用缓存，在内存中记录统计数量

七、可扩展设计

（1）分库、分表拆分改进

MYSQL支持三种分区方式

由于MYSQ分区表的局限性，只有range分区经常使用：

（2）分布式改进

八、满足周边需求

（1）为周边需求额外增加表设计

（2）统计和后台需求

统计相关的维度和线上系统不一致。线上系统可能是通过用户ID来访问，而统计可能是通过地区或性别，所以线上系统的索引不适用于后台统计。

一般的处理方法：

Hello World