当前位置:首页 > 文章列表 > 数据库 > MySQL > 一文解析Redis存储查询ip数据

一文解析Redis存储查询ip数据

来源:SegmentFault 2023-02-19 21:45:53 0浏览 收藏

数据库小白一枚,正在不断学习积累知识,现将学习到的知识记录一下,也是将我的所得分享给大家!而今天这篇文章《一文解析Redis存储查询ip数据》带大家来了解一下一文解析Redis存储查询ip数据,希望对大家的知识积累有所帮助,从而弥补自己的不足,助力实战开发!

今天我的朋友佛手给我打了个电话,他们网站的业务要根据客户的 ip 地址快速定位客户的地理位置。网上已经有一大堆类似的 ip 地址库可以用,但问题是这些地址库的数据表结构大多如下所示

+--------------+------------------+------+-----+---------+----------------+
| Field        | Type             | Null | Key | Default | Extra          |
+--------------+------------------+------+-----+---------+----------------+
| ip_id        | int(11) unsigned | NO   | PRI | NULL    | auto_increment |
| ip_country   | varchar(50)      | NO   |     | NULL    |                |
| ip_startip   | bigint(11)       | NO   | MUL | NULL    |                |
| ip_endip     | bigint(11)       | NO   | MUL | NULL    |                |
| country_code | varchar(2)       | NO   |     | NULL    |                |
| zone_id      | int(11)          | NO   |     | 0       |                |
+--------------+------------------+------+-----+---------+----------------+

最核心的部分是三个:

ip_startip
ip_endip
以及
ip_id
。其中
ip_id
是我们要查询的结果,当然你也可以把
zone_id
ip_country
包括进去。我这里就用
ip_id
来特指查询结果了。

面对这个表,没什么其它办法,你的查询语句只能是

sql
SELECT * FROM who_ip WHERE ip_startip = {ip}

其中

{ip}
是你要查询的 ip 地址,为了方便查询,在 php 中我们一般要用
ip2long
函数把它转换为一个整数。现在问题来了,这个表有 400 万条数据,无论你怎么优化它的索引结构(实际上我觉得这没啥用),在以上查询语句中都要耗费 2 秒以上的时间,对于一个高频使用的接口,这显然是不可忍受的。

REDIS 可以解决这个问题吗?

实际上这也是佛手同学最关心的问题,因为我们知道Redis有强大数据结构和超快的速度,那么我们能设计出适应这种查询场景的结构吗?

范围查询,我首先想到的就是Redis里面的

Sorted Sets
结构,这也是redis中唯一可以指定范围(
SCORE
值)查询的结构了,所以基本上我们的希望都寄托在它身上了。

最简单粗暴的方法就是把

ip_startip
ip_endip
都转化为
Sorted Sets
里的
Score
,然后把
ip_id
定义为
Member
。这样我们的查询就很简单了,只需要用
ZRANGESCORE
查询出离ip最近SCORE对应的两个
ip_id
即可。然后再分析,如果这两个
ip_id
是相同的,那么说明这个ip在这个地址段,如果不同的话证明这个ip地址没有被任何地址段所定义,是一个未知的ip。

基本逻辑是没有问题的,但是最大的问题还是性能上的挑战。根据我的经验,一个

SET
里面放10万条数据以上就已经很慢了,如果放到400万这种量级,我非常怀疑它跟mysql相比还有优势吗?

我设计的存储结构

我的解决方案是把这个地址库切分,每一片区最多保存65536个地址。也就是说如果一个ip地址段为

188.88.77.22 - 188.90.78.10
,那么我们就把它切分为

188.88.77.22 - 188.88.77.255
188.89.0.0 - 188.89.255.255
188.90.0.0 - 189.90.78.10

也就是我们保证每一个ip地址段都被保存在

xxx.xxx.0.0 - xxx.xxx.255.255
的一个区段中,这个区段的理论极限是保存65536个值,实际上要远小于这个数字。而这样的区段理论上也有65536个,这都是ip地址的设计所限,当然实际上也远小于这个值。

因此这样的设计基本上就能满足我们的性能需要了。以下是我用php写的数据切分程序

php
<?php // redis 参数
define(&#39;REDIS_HOST&#39;, &#39;127.0.0.1&#39;);
define(&#39;REDIS_PORT&#39;, 6379);
define(&#39;REDIS_DB&#39;, 10);

define(&#39;MYSQL_HOST&#39;, &#39;localhost&#39;);
define(&#39;MYSQL_PORT&#39;, 3306);
define(&#39;MYSQL_USER&#39;, &#39;root&#39;);
define(&#39;MYSQL_PASS&#39;, &#39;123456&#39;);
define(&#39;MYSQL_DB&#39;, &#39;who_brand&#39;);

define(&#39;MYSQL_TABLE&#39;, &#39;who_ip&#39;);
define(&#39;MYSQL_COLUMN_START&#39;, &#39;ip_startip&#39;);
define(&#39;MYSQL_COLUMN_END&#39;, &#39;ip_endip&#39;);
define(&#39;MYSQL_COLUMN_ID&#39;, &#39;ip_id&#39;);
define(&#39;MYSQL_PAGESIZE&#39;, 1000);

mysql_connect(MYSQL_HOST . &#39;:&#39; . MYSQL_PORT, MYSQL_USER, MYSQL_PASS);
mysql_select_db(MYSQL_DB);

function add_ip($page, $offset, $value) {
 &nbsp; &nbsp;static $redis;

 &nbsp; &nbsp;if (!$redis) {
 &nbsp; &nbsp; &nbsp; &nbsp;$redis = new Redis();
 &nbsp; &nbsp; &nbsp; &nbsp;$redis->connect(REDIS_HOST, REDIS_PORT);
        $redis->select(REDIS_DB);
    }

    $key = 'ip:' . $page;
    $redis->zAdd($key, $offset, $value);
}

$page = 0;
do {
    $offset = $page * MYSQL_PAGESIZE;
    $count = 0;

    $res = mysql_query('SELECT * FROM ' . MYSQL_TABLE . ' LIMIT ' . MYSQL_PAGESIZE . " OFFSET {$offset}");

    while ($ip = mysql_fetch_assoc($res)) {
        $start = $ip[MYSQL_COLUMN_START];
        $end = $ip[MYSQL_COLUMN_END];
        $value = $ip[MYSQL_COLUMN_ID];

        $startOffset = $start % 65536;
        $endOffset = $end % 65536;

        $start -= $startOffset;
        $end -= $endOffset;

        $startPage = $start / 65536;
        $endPage = $end / 65536;

        for ($i = $startPage; $i <p>查询程序也非常简单</p><p></p><pre class="brush:go;">php
<?php define(&#39;REDIS_HOST&#39;, &#39;127.0.0.1&#39;);
define(&#39;REDIS_PORT&#39;, 6379);
define(&#39;REDIS_DB&#39;, 10);

$redis = new Redis();
$redis->connect(REDIS_HOST, REDIS_PORT);
$redis->select(REDIS_DB);

$ip = ip2long('173.255.218.70');
$offset = $ip % 65536;
$page = ($ip - $offset) / 65536;


// 取出小于等于它的最接近值
$start = $redis->zRevRangeByScore('ip:' . $page, 0, $offset, array(
    'limit' => array(0, 1)
));

// 取出大于等于它的最接近值
$end = $redis->zRangeByScore('ip:' . $page, $offset, 65535, array(
    'limit' => array(0, 1)
));

if (empty($start) || empty($end)) {
    echo 'unknown';
    exit;
}

$start = $start[0];
$end = $end[0];

list ($startOp, $startId) = explode(':', $start);
list ($endOp, $endId) = explode(':', $end);

if ($startId != $endId) {
    echo 'unknown';
    exit;
}

echo $startId;

转载自我的博客:http://70.io/develop/use-redis-to-store-ip-data.html

以上就是《一文解析Redis存储查询ip数据》的详细内容,更多关于mysql的资料请关注golang学习网公众号!

版本声明
本文转载于:SegmentFault 如有侵犯,请联系study_golang@163.com删除
解决python2.7在查询mysql时出现中文乱码解决python2.7在查询mysql时出现中文乱码
上一篇
解决python2.7在查询mysql时出现中文乱码
MySQL入门之MySQL安装及资料库概述
下一篇
MySQL入门之MySQL安装及资料库概述
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ChatExcel酷表:告别Excel难题,北大团队AI助手助您轻松处理数据
    ChatExcel酷表
    ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
    3166次使用
  • Any绘本:开源免费AI绘本创作工具深度解析
    Any绘本
    探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
    3379次使用
  • 可赞AI:AI驱动办公可视化智能工具,一键高效生成文档图表脑图
    可赞AI
    可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
    3408次使用
  • 星月写作:AI网文创作神器,助力爆款小说速成
    星月写作
    星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
    4512次使用
  • MagicLight.ai:叙事驱动AI动画视频创作平台 | 高效生成专业级故事动画
    MagicLight
    MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
    3788次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码