当前位置:首页 > 文章列表 > Golang > Go问答 > 为什么 Go 的套接字性能不如 C++ 的套接字?

为什么 Go 的套接字性能不如 C++ 的套接字?

来源:stackoverflow 2024-03-07 15:51:25 0浏览 收藏

从现在开始,我们要努力学习啦!今天我给大家带来《为什么 Go 的套接字性能不如 C++ 的套接字?》,感兴趣的朋友请继续看下去吧!下文中的内容我们主要会涉及到等等知识点,如果在阅读本文过程中有遇到不清楚的地方,欢迎留言呀!我们一起讨论,一起学习!

问题内容

我在 go 和 c++ 中对一个简单的套接字乒乓测试进行了基准测试。客户端首先向服务器发送 0。服务器递增它获得的任何数字并将其发送回客户端。客户端将数字回显给服务器,并在数字达到 1,000,000 时停止。

客户端和服务器都在同一台计算机上,因此我在这两种情况下都使用 unix 套接字。 (我还尝试了同主机 tcp 套接字,显示了类似的结果)。

go 测试需要 14 秒,而 c++ 测试需要 8 秒。这让我感到惊讶,因为我已经运行了相当多的 go 与 c++ 基准测试,并且只要我不触发垃圾收集器,通常 go 的性能与 c++ 一样。

我使用的是 mac,尽管评论者也报告 go 版本在 linux 上速度较慢。

想知道我是否缺少优化 go 程序的方法,或者是否只是底层效率低下。

以下是我执行测试时运行的命令以及测试结果。所有代码文件都粘贴在该问题的底部。

运行go服务器:

$ rm /tmp/go.sock
$ go run socketunixserver.go

运行go客户端:

$ go build socketunixclient.go; time ./socketunixclient

real    0m14.101s
user    0m5.242s
sys     0m7.883s

运行 c++ 服务器:

$ rm /tmp/cpp.sock
$ clang++ -std=c++11 tcpserverincunix.cpp -o3; ./a.out

运行 c++ 客户端:

$ clang++ -std=c++11 tcpclientincunix.cpp -o3; time ./a.out

real    0m8.690s
user    0m0.835s
sys     0m3.800s

代码文件

转到服务器:

// socketunixserver.go

package main

import (
    "log"
    "net"
    "encoding/binary"
)

func main() {
    ln, err := net.listen("unix", "/tmp/go.sock")
    if err != nil {
        log.fatal("listen error: ", err)
    }

    c, err := ln.accept()
    if err != nil {
        panic(err)
    }
    log.println("connected with client!")

    readbuf := make([]byte, 4)
    writebuf := make([]byte, 4)
    for {
        c.read(readbuf)
        clientnum := binary.bigendian.uint32(readbuf)
        binary.bigendian.putuint32(writebuf, clientnum+1)

        c.write(writebuf)
    }
}

go 客户端:

// socketunixclient.go

package main

import (
    "log"
    "net"
    "encoding/binary"
)

const n = 1000000

func main() {
    c, err := net.dial("unix", "/tmp/go.sock")
    if err != nil {
        log.fatal("dial error", err)
    }
    defer c.close()

    readbuf := make([]byte, 4)
    writebuf := make([]byte, 4)

    var currnumber uint32 = 0
    for currnumber < n {
        binary.bigendian.putuint32(writebuf, currnumber)
        c.write(writebuf)

        // read the incremented number from server
        c.read(readbuf[:])
        currnumber = binary.bigendian.uint32(readbuf)
    }
}

c++ 服务器:

// tcpserverincunix.cpp

// server side c/c++ program to demonstrate socket programming
// #include <iostream>
#include <unistd.h>
#include <stdio.h>
#include <sys/un.h>
#include <sys/socket.h>
#include <stdlib.h>
#include <netinet/in.h>
#include <netinet/tcp.h>
#include <string.h>
#include <unistd.h>

// big endian (network order)
unsigned int frombytes(unsigned char b[4]) {
    return b[3] | b[2]<<8 | b[1]<<16 | b[0]<<24;
}

void tobytes(unsigned int x, unsigned char (&b)[4]) {
    b[3] = x;
    b[2] = x>>8;
    b[1] = x>>16;
    b[0] = x>>24;
}

int main(int argc, char const *argv[])
{
    int server_fd, new_socket, valread;
    struct sockaddr_un saddr;
    int saddrlen = sizeof(saddr);
    unsigned char recv_buffer[4] = {0};
    unsigned char send_buffer[4] = {0};

    server_fd = socket(af_unix, sock_stream, 0);

    saddr.sun_family = af_unix;
    strncpy(saddr.sun_path, "/tmp/cpp.sock", sizeof(saddr.sun_path));
    saddr.sun_path[sizeof(saddr.sun_path)-1] = '\0';
    bind(server_fd, (struct sockaddr *)&saddr, sizeof(saddr));

    listen(server_fd, 3);

    // accept one client connection
    new_socket = accept(server_fd, (struct sockaddr *)&saddr, (socklen_t*)&saddrlen);
    printf("connected with client!\n");

    // note: if /tmp/cpp.sock already exists, you'll get the connected with client!
    // message before running the client. delete this file first.

    unsigned int x = 0;

    while (true) {
        valread = read(new_socket, recv_buffer, 4);
        x = frombytes(recv_buffer);
        tobytes(x+1, send_buffer);

        write(new_socket, send_buffer, 4);
    }
}

c++ 客户端:

// tcpClientIncUnix.cpp

// Server side C/C++ program to demonstrate Socket programming
// #include <iostream>
#include <unistd.h>
#include <stdio.h>
#include <sys/socket.h>
#include <sys/un.h>
#include <stdlib.h>
#include <netinet/in.h>
#include <netinet/tcp.h>
#include <string.h>
#include <unistd.h>

// Big Endian (network order)
unsigned int fromBytes(unsigned char b[4]) {
    return b[3] | b[2]<<8 | b[1]<<16 | b[0]<<24;
}

void toBytes(unsigned int x, unsigned char (&b)[4]) {
    b[3] = x;
    b[2] = x>>8;
    b[1] = x>>16;
    b[0] = x>>24;
}

int main(int argc, char const *argv[])
{
    int sock, valread;
    struct sockaddr_un saddr;
    int opt = 1;
    int saddrlen = sizeof(saddr);

    // We'll be passing uint32's back and forth
    unsigned char recv_buffer[4] = {0};
    unsigned char send_buffer[4] = {0};

    sock = socket(AF_UNIX, SOCK_STREAM, 0);

    saddr.sun_family = AF_UNIX;
    strncpy(saddr.sun_path, "/tmp/cpp.sock", sizeof(saddr.sun_path));
    saddr.sun_path[sizeof(saddr.sun_path)-1] = '\0';

    // Accept one client connection
    if (connect(sock, (struct sockaddr *)&saddr, sizeof(saddr)) != 0) {
        throw("connect failed");
    }

    int n = 1000000;

    unsigned int currNumber = 0;
    while (currNumber < n) {
        toBytes(currNumber, send_buffer);
        write(sock, send_buffer, 4);

        // Read the incremented number from server
        valread = read(sock, recv_buffer, 4);
        currNumber = fromBytes(recv_buffer);
    }
}

解决方案


首先,我确认这个问题中的 go 程序的运行速度确实比 c++ 程序慢得多。我认为了解其中的原因确实很有趣。

我使用 pprof 分析了 go 客户端和服务器,发现 syscall.syscall 占用了总执行时间的 70%。根据 this 票证,go 中的系统调用比 c 中大约慢 1.4 倍。

(pprof) top -cum
Showing nodes accounting for 18.78s, 67.97% of 27.63s total
Dropped 44 nodes (cum <= 0.14s)
Showing top 10 nodes out of 44
  flat  flat%   sum%        cum   cum%
 0.11s   0.4%   0.4%     22.65s 81.98%  main.main
     0     0%   0.4%     22.65s 81.98%  runtime.main
18.14s 65.65% 66.05%     19.91s 72.06%  syscall.Syscall
 0.03s  0.11% 66.16%     12.91s 46.72%  net.(*conn).Read
 0.10s  0.36% 66.52%     12.88s 46.62%  net.(*netFD).Read
 0.16s  0.58% 67.10%     12.78s 46.25%  internal/poll.(*FD).Read
 0.06s  0.22% 67.32%     11.87s 42.96%  syscall.Read
 0.11s   0.4% 67.72%     11.81s 42.74%  syscall.read
 0.02s 0.072% 67.79%      9.30s 33.66%  net.(*conn).Write
 0.05s  0.18% 67.97%      9.28s 33.59%  net.(*netFD).Write

我逐渐减少了 conn.writeconn.read 调用的数量,并相应地增加了缓冲区的大小,以便传输的字节数保持不变。结果是程序进行的调用越少,其性能就越接近 c++ 版本。

终于介绍完啦!小伙伴们,这篇关于《为什么 Go 的套接字性能不如 C++ 的套接字?》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布Golang相关知识,快来关注吧!

版本声明
本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
使用PHP实现Socket通信使用PHP实现Socket通信
上一篇
使用PHP实现Socket通信
深度解析Oracle各个版本的发展历程
下一篇
深度解析Oracle各个版本的发展历程
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 茅茅虫AIGC检测:精准识别AI生成内容,保障学术诚信
    茅茅虫AIGC检测
    茅茅虫AIGC检测,湖南茅茅虫科技有限公司倾力打造,运用NLP技术精准识别AI生成文本,提供论文、专著等学术文本的AIGC检测服务。支持多种格式,生成可视化报告,保障您的学术诚信和内容质量。
    39次使用
  • 赛林匹克平台:科技赛事聚合,赋能AI、算力、量子计算创新
    赛林匹克平台(Challympics)
    探索赛林匹克平台Challympics,一个聚焦人工智能、算力算法、量子计算等前沿技术的赛事聚合平台。连接产学研用,助力科技创新与产业升级。
    60次使用
  • SEO  笔格AIPPT:AI智能PPT制作,免费生成,高效演示
    笔格AIPPT
    SEO 笔格AIPPT是135编辑器推出的AI智能PPT制作平台,依托DeepSeek大模型,实现智能大纲生成、一键PPT生成、AI文字优化、图像生成等功能。免费试用,提升PPT制作效率,适用于商务演示、教育培训等多种场景。
    70次使用
  • 稿定PPT:在线AI演示设计,高效PPT制作工具
    稿定PPT
    告别PPT制作难题!稿定PPT提供海量模板、AI智能生成、在线协作,助您轻松制作专业演示文稿。职场办公、教育学习、企业服务全覆盖,降本增效,释放创意!
    65次使用
  • Suno苏诺中文版:AI音乐创作平台,人人都是音乐家
    Suno苏诺中文版
    探索Suno苏诺中文版,一款颠覆传统音乐创作的AI平台。无需专业技能,轻松创作个性化音乐。智能词曲生成、风格迁移、海量音效,释放您的音乐灵感!
    69次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码