当前位置:首页 > 文章列表 > Golang > Go问答 > 使用ticker定期定时加载内存中所有不断变化的路径中的文件

使用ticker定期定时加载内存中所有不断变化的路径中的文件

来源:stackoverflow 2024-02-28 17:45:24 0浏览 收藏

IT行业相对于一般传统行业,发展更新速度更快,一旦停止了学习,很快就会被行业所淘汰。所以我们需要踏踏实实的不断学习,精进自己的技术,尤其是初学者。今天golang学习网给大家整理了《使用ticker定期定时加载内存中所有不断变化的路径中的文件》,聊聊,我们一起来看看吧!

问题内容

我有一个应用程序需要从两个不同的路径读取文件。读取所有这些文件后,我需要将它们加载到 products 地图的内存中。

路径:

  • full:这是内存中服务器启动期间需要加载的所有文件的路径。该路径将包含大约 50 个文件,每个文件大小约为 60mb。
  • delta:这是包含我们需要每 1 分钟定期加载到内存中的所有增量文件的路径。这些文件仅包含与完整路径文件的差异。该路径将包含大约 60 个文件,每个文件大小约为 20mb。

下面的代码 watchdeltapath 在服务器启动期间被调用以监视增量更改。它将从 getdeltapath 方法获取增量路径,并从该路径我需要加载内存中的所有文件。 此增量路径每隔几分钟就会发生变化,我不会错过任何一个增量路径以及该路径中的所有文件

loadallfiles 方法加载内存中的所有文件可能需要一些时间(大约 5 分钟),所以我试图找到一种方法,让我不应该错过任何新的增量路径(因为它每隔几分钟就会不断变化)并且应该能够定期从增量路径加载内存中的所有这些文件,不会出现任何问题且高效。

我得到了下面的代码,每 1 分钟运行一次,每次都会查找新的 delta 路径 ,然后从内存中的该路径加载所有文件。它工作得很好,但我认为这不是正确的方法。如果 loadallfiles 方法需要超过 10 分钟来加载内存中的所有文件,并且我的代码每 1 分钟运行一次以查找新的增量路径,然后找到该新路径中的所有文件,然后加载到内存中,会发生什么情况?它会继续创建大量后台线程并可能大幅增加 cpu 使用率吗?

type applicationRepository struct {
  client         customer.Client
  logger         log.Logger
  done           chan struct{}
  products       *cmap.ConcurrentMap
}

// this will be called only once
func (r *applicationRepository) watchDeltaPath() error {
    ticker := time.NewTicker(1 * time.Minute)
    go func() {
        select {
        case <-r.done:
            ticker.Stop()
            return
        case <-ticker.C:
            func() (result error) {
                trans := r.logger.StartTransaction(nil, "delta-changes", "")
                defer trans.End()
                defer func() {
                    if result != nil {
                        trans.Errorf("Recovered from error: %v")
                    } else if err := recover(); err != nil {
                        trans.Errorf("Recovered from panic: %v", err)
                    }
                }()
                // get latest delta path everytime as it keeps changing every few minutes
                path, err := r.client.GetDeltaPath("delta")
                if err != nil {
                    return err
                }
                // load all the files in memory in "products" map from that path
                err = r.loadAllFiles(path)
                if err != nil {
                    return err
                }
                return nil
            }()
        }
    }()
    return nil
}

func (r *applicationRepository) Stop() {
    r.done <- struct{}{}
}

在产品中有效地做到这一点的最佳方法是什么?

这是我对代码的执行方式的玩弄 - https://go.dev/play/p/fs4-b0fwwte


正确答案


根据评论,“在产品中有效地做到这一点的最佳方法”取决于很多因素,并且在像 stack overflow 这样的网站上可能无法回答。话虽如此,我可以提出一种方法,可以让您更容易地思考如何最好地解决问题。

下面的代码(playground;非常粗糙且未经测试)演示了使用三个 go 例程的方法:

  1. 检测新的增量路径并将其推送到缓冲通道
  2. 处理初始负载
  3. 等待初始加载完成,然后应用增量(请注意,这会处理初始加载正在进行时发现的增量)

如上所述,问题中没有足够的细节来确定这是否是一个好方法。初始负载和增量可能可以同时运行而不会使 io 饱和,但这需要测试(并且是一个相对较小的变化)。

// simulation of process to perform initial load and handle deltas
package main

import (
    "fmt"
    "strconv"
    "sync"
    "time"
)

const deltabuffer = 100
const initialloadtime = time.duration(time.duration(1.5 * float32(time.second)))
const deltacheckfrequency = time.duration(500 * time.millisecond)

func main() {
    ar := newapplicationrepository()
    time.sleep(5 * time.second)
    ar.stop()
    fmt.println(time.now(), "complete")
}

type applicationrepository struct {
    deltachan       chan string   // could be some other type...
    initialloaddone chan struct{} // closed when initial load finished

    done chan struct{}
    wg   sync.waitgroup
}

func newapplicationrepository() *applicationrepository {
    ar := applicationrepository{
        deltachan:       make(chan string, deltabuffer),
        initialloaddone: make(chan struct{}),
        done:            make(chan struct{}),
    }

    ar.wg.add(3)
    go ar.detectnewdeltas()
    go ar.initialload()
    go ar.deltaload()

    return &ar
}

// detectnewdeltas - watch for new delta paths
func (a *applicationrepository) detectnewdeltas() {
    defer a.wg.done()
    var previousdelta string
    for {
        select {
        case <-time.after(deltacheckfrequency):
            dp := a.getdeltapath()
            if dp != previousdelta {
                select {
                case a.deltachan <- dp:
                default:
                    panic("channel full - no idea what to do here!")
                }
                previousdelta = dp
            }
        case <-a.done:
            return
        }
    }
}

// getdeltapath in real application this will retrieve the delta path
func (a *applicationrepository) getdeltapath() string {
    return strconv.itoa(time.now().second()) // for now just return the current second..
}

// initialload - load the initial data
func (a *applicationrepository) initialload() {
    defer a.wg.done()
    defer close(a.initialloaddone)
    time.sleep(initialloadtime) // simulate time taken for initial load
}

// deltaload- load deltas found by detectnewdeltas
func (a *applicationrepository) deltaload() {
    defer a.wg.done()
    fmt.println(time.now(), "deltaload started")

    // wait for initial load to complete before doing anything
    <-a.initialloaddone
    fmt.println(time.now(), "initial load done")

    // wait for incoming deltas and load them
    for {
        select {
        case newdelta := <-a.deltachan:
            fmt.println(time.now(), newdelta)
        case <-a.done:
            return
        }
    }
}

// stop - signal loader to stop and wait until this is done
func (a *applicationrepository) stop() {
    close(a.done)
    a.wg.wait()
}

我想你想要 golang 并发模式:扇入、扇出。您可以在 google 中搜索。

我创建了一个示例代码。您可以复制粘贴它并创建文件夹 fulldelta ,其中包含虚拟文件。

package main

import (
    "fmt"
    "log"
    "os"
    "path/filepath"
    "sync"
    "time"
)

type MyFile struct {
    full         map[string][]byte
    delta        map[string][]byte
    files        []string
    stopAutoLoad chan struct{}
}

func FilePathWalkDir(root string) ([]string, error) {
    var files []string
    err := filepath.Walk(root, func(path string, info os.FileInfo, err error) error {
        if !info.IsDir() {
            files = append(files, path)
        }
        return nil
    })
    return files, err
}

func main() {
    mf := NewMyFile()
    mf.StartAutoLoadDelta(10 * time.Second)

    // time.Sleep(15 * time.Second)
    // mf.StopAutoLoadDelta()

    time.Sleep(50 * time.Minute)
    fmt.Println(len(mf.full))
    fmt.Println(len(mf.delta))
}

func NewMyFile() *MyFile {
    mf := &MyFile{
        full:         make(map[string][]byte),
        delta:        make(map[string][]byte),
        stopAutoLoad: make(chan struct{}),
    }

    mf.LoadFile("full", 0)
    mf.LoadFile("delta", 0)
    return mf
}

func (mf *MyFile) StartAutoLoadDelta(d time.Duration) {
    ticker := time.NewTicker(d)

    go func() {
        defer func() {
            ticker.Stop()
        }()

        i := 1
        for {
            select {
            case <-ticker.C:
                // mf.deleteCurrentDelta()
                mf.LoadFile("delta", i)
                fmt.Println("In Memory:")
                for k, v := range mf.delta {
                    fmt.Printf("key : %s\t\tlen: %d\n", k, len(v))
                }
                i++
            case <-mf.stopAutoLoad:
                return
            }
        }
    }()
}

func (mf *MyFile) StopAutoLoadDelta() {
    fmt.Println("Stopping autoload Delta")
    mf.stopAutoLoad <- struct{}{}
}

func (mf *MyFile) deleteCurrentDelta() {
    for k, _ := range mf.delta {
        fmt.Println("data deleted: ", k)
        delete(mf.delta, k)
    }
}

type Fileinfo struct {
    name string
    data []byte
    err  error
}

func (mf *MyFile) LoadFile(prefix string, i int) {
    log.Printf("%s load : %d", prefix, i)
    files, err := FilePathWalkDir(prefix)
    if err != nil {
        panic("failed to open delta directory")
    }

    newFiles := make([]string, 0)

    for _, v := range files {
        if _, ok := mf.delta[v]; !ok {
            newFiles = append(newFiles, v)
        }
    }

    chanJobs := GenerateJobs(prefix, newFiles)
    chanResultJobs := ReadFiles(chanJobs, 8)
    counterTotal := 0
    counterSuccess := 0
    for results := range chanResultJobs {
        if results.err != nil {
            log.Printf("error creating file %s. stack trace: %s", results.name, results.err)
        } else {
            switch prefix {
            case "delta":
                mf.delta[results.name] = results.data
            case "full":
                mf.full[results.name] = results.data
            default:
                panic("not implemented")
            }
            counterSuccess++
        }
        counterTotal++
    }

    log.Printf("status jobs running: %d/%d", counterSuccess, counterTotal)
}

func GenerateJobs(prefix string, files []string) <-chan Fileinfo {
    chanOut := make(chan Fileinfo)

    go func() {
        for _, v := range files {
            chanOut <- Fileinfo{
                name: v,
            }
        }
        close(chanOut)
    }()

    return chanOut
}

func ReadFiles(chanIn <-chan Fileinfo, worker int) <-chan Fileinfo {
    chanOut := make(chan Fileinfo)

    var wg sync.WaitGroup

    wg.Add(worker)

    go func() {
        for i := 0; i < worker; i++ {
            go func(workerIndex int) {
                defer wg.Done()
                for job := range chanIn {
                    log.Printf("worker %d is reading file %s", workerIndex, job.name)
                    data, err := os.ReadFile(job.name)
                    chanOut <- Fileinfo{
                        name: job.name,
                        data: data,
                        err:  err,
                    }
                }
            }(i)
        }
    }()

    go func() {
        wg.Wait()
        close(chanOut)
    }()
    return chanOut
}

以上就是《使用ticker定期定时加载内存中所有不断变化的路径中的文件》的详细内容,更多关于的资料请关注golang学习网公众号!

版本声明
本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
发现Golang常用的标准库和包发现Golang常用的标准库和包
上一篇
发现Golang常用的标准库和包
创建macOS系统的虚拟机并设置固件类型
下一篇
创建macOS系统的虚拟机并设置固件类型
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • AI Make Song:零门槛AI音乐创作平台,助你轻松制作个性化音乐
    AI Make Song
    AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
    18次使用
  • SongGenerator.io:零门槛AI音乐生成器,快速创作高质量音乐
    SongGenerator
    探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
    14次使用
  •  BeArt AI换脸:免费在线工具,轻松实现照片、视频、GIF换脸
    BeArt AI换脸
    探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
    14次使用
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    17次使用
  • Brev AI:零注册门槛的全功能免费AI音乐创作平台
    Brev AI
    探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
    19次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码