一文解析Redis存储查询ip数据
来源:SegmentFault
2023-02-19 21:45:53
0浏览
收藏
数据库小白一枚,正在不断学习积累知识,现将学习到的知识记录一下,也是将我的所得分享给大家!而今天这篇文章《一文解析Redis存储查询ip数据》带大家来了解一下一文解析Redis存储查询ip数据,希望对大家的知识积累有所帮助,从而弥补自己的不足,助力实战开发!
今天我的朋友佛手给我打了个电话,他们网站的业务要根据客户的 ip 地址快速定位客户的地理位置。网上已经有一大堆类似的 ip 地址库可以用,但问题是这些地址库的数据表结构大多如下所示
+--------------+------------------+------+-----+---------+----------------+ | Field | Type | Null | Key | Default | Extra | +--------------+------------------+------+-----+---------+----------------+ | ip_id | int(11) unsigned | NO | PRI | NULL | auto_increment | | ip_country | varchar(50) | NO | | NULL | | | ip_startip | bigint(11) | NO | MUL | NULL | | | ip_endip | bigint(11) | NO | MUL | NULL | | | country_code | varchar(2) | NO | | NULL | | | zone_id | int(11) | NO | | 0 | | +--------------+------------------+------+-----+---------+----------------+
最核心的部分是三个:
ip_startip、
ip_endip以及
ip_id。其中
ip_id是我们要查询的结果,当然你也可以把
zone_id和
ip_country包括进去。我这里就用
ip_id来特指查询结果了。
面对这个表,没什么其它办法,你的查询语句只能是
sql
SELECT * FROM who_ip WHERE ip_startip = {ip}
其中
{ip}是你要查询的 ip 地址,为了方便查询,在 php 中我们一般要用
ip2long函数把它转换为一个整数。现在问题来了,这个表有 400 万条数据,无论你怎么优化它的索引结构(实际上我觉得这没啥用),在以上查询语句中都要耗费 2 秒以上的时间,对于一个高频使用的接口,这显然是不可忍受的。
REDIS 可以解决这个问题吗?
实际上这也是佛手同学最关心的问题,因为我们知道Redis有强大数据结构和超快的速度,那么我们能设计出适应这种查询场景的结构吗?
范围查询,我首先想到的就是Redis里面的
Sorted Sets结构,这也是redis中唯一可以指定范围(
SCORE值)查询的结构了,所以基本上我们的希望都寄托在它身上了。
最简单粗暴的方法就是把
ip_startip和
ip_endip都转化为
Sorted Sets里的
Score,然后把
ip_id定义为
Member。这样我们的查询就很简单了,只需要用
ZRANGESCORE查询出离ip最近SCORE对应的两个
ip_id即可。然后再分析,如果这两个
ip_id是相同的,那么说明这个ip在这个地址段,如果不同的话证明这个ip地址没有被任何地址段所定义,是一个未知的ip。
基本逻辑是没有问题的,但是最大的问题还是性能上的挑战。根据我的经验,一个
SET里面放10万条数据以上就已经很慢了,如果放到400万这种量级,我非常怀疑它跟mysql相比还有优势吗?
我设计的存储结构
我的解决方案是把这个地址库切分,每一片区最多保存65536个地址。也就是说如果一个ip地址段为
188.88.77.22 - 188.90.78.10,那么我们就把它切分为
188.88.77.22 - 188.88.77.255 188.89.0.0 - 188.89.255.255 188.90.0.0 - 189.90.78.10
也就是我们保证每一个ip地址段都被保存在
xxx.xxx.0.0 - xxx.xxx.255.255的一个区段中,这个区段的理论极限是保存65536个值,实际上要远小于这个数字。而这样的区段理论上也有65536个,这都是ip地址的设计所限,当然实际上也远小于这个值。
因此这样的设计基本上就能满足我们的性能需要了。以下是我用php写的数据切分程序
php
connect(REDIS_HOST, REDIS_PORT); $redis->select(REDIS_DB); } $key = 'ip:' . $page; $redis->zAdd($key, $offset, $value); } $page = 0; do { $offset = $page * MYSQL_PAGESIZE; $count = 0; $res = mysql_query('SELECT * FROM ' . MYSQL_TABLE . ' LIMIT ' . MYSQL_PAGESIZE . " OFFSET {$offset}"); while ($ip = mysql_fetch_assoc($res)) { $start = $ip[MYSQL_COLUMN_START]; $end = $ip[MYSQL_COLUMN_END]; $value = $ip[MYSQL_COLUMN_ID]; $startOffset = $start % 65536; $endOffset = $end % 65536; $start -= $startOffset; $end -= $endOffset; $startPage = $start / 65536; $endPage = $end / 65536; for ($i = $startPage; $i查询程序也非常简单
phpconnect(REDIS_HOST, REDIS_PORT); $redis->select(REDIS_DB); $ip = ip2long('173.255.218.70'); $offset = $ip % 65536; $page = ($ip - $offset) / 65536; // 取出小于等于它的最接近值 $start = $redis->zRevRangeByScore('ip:' . $page, 0, $offset, array( 'limit' => array(0, 1) )); // 取出大于等于它的最接近值 $end = $redis->zRangeByScore('ip:' . $page, $offset, 65535, array( 'limit' => array(0, 1) )); if (empty($start) || empty($end)) { echo 'unknown'; exit; } $start = $start[0]; $end = $end[0]; list ($startOp, $startId) = explode(':', $start); list ($endOp, $endId) = explode(':', $end); if ($startId != $endId) { echo 'unknown'; exit; } echo $startId;转载自我的博客:http://70.io/develop/use-redis-to-store-ip-data.html
以上就是《一文解析Redis存储查询ip数据》的详细内容,更多关于mysql的资料请关注golang学习网公众号!
版本声明
本文转载于:SegmentFault 如有侵犯,请联系study_golang@163.com删除

- 上一篇
- 解决python2.7在查询mysql时出现中文乱码

- 下一篇
- MySQL入门之MySQL安装及资料库概述
评论列表
-
- 正直的冬天
- 赞 👍👍,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,帮助很大,总算是懂了,感谢师傅分享文章!
- 2023-05-06 13:23:52
-
- 害怕的楼房
- 这篇技术贴出现的刚刚好,很详细,写的不错,已加入收藏夹了,关注作者了!希望作者能多写数据库相关的文章。
- 2023-03-29 23:09:54
-
- 机灵的花生
- 细节满满,已加入收藏夹了,感谢大佬的这篇技术贴,我会继续支持!
- 2023-03-17 02:00:31
-
- 等待的棒棒糖
- 这篇博文真及时,作者大大加油!
- 2023-03-01 08:27:32
查看更多
最新文章
-
- 数据库 · MySQL | 3小时前 | mysql 字符集 中文乱码 utf8mb4 utf8mb4_unicode_ci
- MySQL中文乱码解决方案与字符集修改命令大全
- 339浏览 收藏
-
- 数据库 · MySQL | 1天前 | 索引 数据类型 字符集 存储引擎 CREATETABLE
- MySQL新建表操作指南与建表技巧
- 462浏览 收藏
-
- 数据库 · MySQL | 1个月前 | 条件判断
- CASEWHEN条件判断的嵌套使用详解与实战场景分析
- 469浏览 收藏
-
- 数据库 · MySQL | 1个月前 | java php
- CSV文件批量导入MySQL的性能优化秘籍大揭秘
- 289浏览 收藏
-
- 数据库 · MySQL | 1个月前 |
- GaleraCluster多主集群配置与冲突解决攻略
- 239浏览 收藏
查看更多
课程推荐
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
查看更多
AI推荐
-
- 笔灵AI生成答辩PPT
- 探索笔灵AI生成答辩PPT的强大功能,快速制作高质量答辩PPT。精准内容提取、多样模板匹配、数据可视化、配套自述稿生成,让您的学术和职场展示更加专业与高效。
- 20次使用
-
- 知网AIGC检测服务系统
- 知网AIGC检测服务系统,专注于检测学术文本中的疑似AI生成内容。依托知网海量高质量文献资源,结合先进的“知识增强AIGC检测技术”,系统能够从语言模式和语义逻辑两方面精准识别AI生成内容,适用于学术研究、教育和企业领域,确保文本的真实性和原创性。
- 29次使用
-
- AIGC检测-Aibiye
- AIbiye官网推出的AIGC检测服务,专注于检测ChatGPT、Gemini、Claude等AIGC工具生成的文本,帮助用户确保论文的原创性和学术规范。支持txt和doc(x)格式,检测范围为论文正文,提供高准确性和便捷的用户体验。
- 35次使用
-
- 易笔AI论文
- 易笔AI论文平台提供自动写作、格式校对、查重检测等功能,支持多种学术领域的论文生成。价格优惠,界面友好,操作简便,适用于学术研究者、学生及论文辅导机构。
- 43次使用
-
- 笔启AI论文写作平台
- 笔启AI论文写作平台提供多类型论文生成服务,支持多语言写作,满足学术研究者、学生和职场人士的需求。平台采用AI 4.0版本,确保论文质量和原创性,并提供查重保障和隐私保护。
- 37次使用
查看更多
相关文章
-
- golang MySQL实现对数据库表存储获取操作示例
- 2022-12-22 499浏览
-
- 分享Redis高可用架构设计实践
- 2023-01-24 286浏览
-
- 搞一个自娱自乐的博客(二) 架构搭建
- 2023-02-16 244浏览
-
- B-Tree、B+Tree以及B-link Tree
- 2023-01-19 235浏览
-
- mysql面试题
- 2023-01-17 157浏览