当前位置:首页 > 文章列表 > 文章 > python教程 > “ Python程序过滤CSV行并将输出写入新文件”

“ Python程序过滤CSV行并将输出写入新文件”

来源:dev.to 2025-02-16 23:48:59 0浏览 收藏

学习知识要善于思考,思考,再思考!今天golang学习网小编就给大家带来《“ Python程序过滤CSV行并将输出写入新文件”》,以下内容主要包含等知识点,如果你正在学习或准备学习文章,就都不要错过本文啦~让我们一起来看看吧,能帮助到你就更好了!

import csv

input_file = 'input.csv'
output_file = 'output.csv'
column_index = 1

with open(input_file, 'r') as infile:
    csv_reader = csv.reader(infile)
    header = next(csv_reader)
    filtered_rows = [header]

    for row in csv_reader:
        if float(row[column_index]) > 100:
            filtered_rows.append(row)

with open(output_file, 'w', newline='') as outfile:
    csv_writer = csv.writer(outfile)
    csv_writer.writerows(filtered_rows)

print("filtered rows have been written to output.csv")


代码逻辑如下;

>
  1. >导入csv模块
    > 代码首先导入csv模块,该模块可以帮助我们读取和写入csv文件。

  2. >文件路径和列索引

    >

    input_file ='input.csv'告诉程序在哪里找到我们要读取的文件。
    • output_file ='output.csv'是程序将保存过滤数据的地方。>
    • column_index = 1指示我们将检查值的列(在这种情况下为第二列,因为列计数从0开始)。
    >打开输入文件
  3. > 该程序打开input.csv文件以读取内部的数据。

    >

    >读取标题
  4. 它读取文件的第一行,其中包含列名,并将其存储在标题中。这将稍后在写入新文件时使用。
  5. >
    过滤行

  6. 该程序通过每一行数据:
  7. >它检查指定列中的数字(第二列)是否大于100。 如果该数字大于100,则该程序将保持该行。
    如果不是,则行跳过。

    >
    • >写入输出文件
    • > 过滤后,该程序将标题和剩余的行(满足条件)写入称为output.csv。
  8. 打印消息

    最后,该程序打印一条消息,让您知道已过滤的数据已保存到新文件中。
    2a。 ** python多线程解决方案,以同时下载多个文件。

  9. >
  10. import threading
    import requests
    
    urls = [
        'https://example.com/file1.jpg',
        'https://example.com/file2.jpg',
        'https://example.com/file3.jpg'
    ]
    
    def download_file(url):
        try:
            response = requests.get(url)
            filename = url.split('/')[-1]
            with open(filename, 'wb') as f:
                f.write(response.content)
            print(f"downloaded: {filename}")
        except exception as e:
            print(f"failed to download {url}: {e}")
    
    threads = []
    for url in urls:
        thread = threading.thread(target=download_file, args=(url,))
        threads.append(thread)
        thread.start()
    
    for thread in threads:
        thread.join()
    
    print("all downloads are complete.")
    

    说明代码:

    url列表
  11. :urls包含要下载的文件url列表。

下载函数:download_file(url)是一个从url下载单个文件并保存它的函数。

线程创建

:对于每个url,使用螺纹创建一个新线程。线程同时下载文件。
    >
  1. 启动线程:在每个线程上调用start()方法开始下载文件。
  2. 等待完成:join()确保主要程序等待所有线程在打印“所有下载均已完成”之前完成。
  3. 2b。一个多处理脚本,以计算1到10的数字阶乘。
    import multiprocessing
    
    def factorial(n):
        result = 1
        for i in range(1, n + 1):
            result *= i
        print(f"factorial of {n} is {result}")
    
    if __name__ == '__main__':
        for i in range(1, 11):
            process = multiprocessing.process(target=factorial, args=(i,))
            process.start()
            process.join()
    
        print("all factorials have been computed.")
    
  4. 解释:
  5. fortorial(n)函数
  6. :计算数字n的阶乘并打印结果。 >主块
  7. :在if __name__ =='__ -main __'块:

通过1到10的数字循环。 对于每个数字,创建一个新的过程来计算其阶乘。 >开始每个过程,然后等待使用process.join()在移至下一个过程中完成。

  1. > 2c一个简单的python脚本,该脚本演示了如何使用conturrent。
    import pandas as pd
    import concurrent.futures
    
    def modify_row(row):
        row['modified'] = row['value'] * 2
        return row
    
    def main():
        data = {'value': [1, 2, 3, 4, 5]}
        df = pd.DataFrame(data)
    
        with concurrent.futures.ThreadPoolExecutor() as executor:
            results = list(executor.map(modify_row, [row for _, row in df.iterrows()]))
    
        df = pd.DataFrame(results)
        print(df)
    
    if __name__ == '__main__':
        main()
    
    解释:
  2. dataframe
      :使用列“值”创建一个简单的数据框df。
    • > modify_row函数
    • :此函数通过添加新列“修改”来修改行,其中值是原始的'value'乘以2。
    • threadpoolexecutor
executor.map(modify_row,[...])在数据框中的每一行中并行运行modify_row函数。


结果

:修改后的数据框在末尾打印出来。

>
  1. 今天关于《“ Python程序过滤CSV行并将输出写入新文件”》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

版本声明
本文转载于:dev.to 如有侵犯,请联系study_golang@163.com删除
小米SU7 Ultra太空银实车图曝光!将提供五款车色小米SU7 Ultra太空银实车图曝光!将提供五款车色
上一篇
小米SU7 Ultra太空银实车图曝光!将提供五款车色
win11近期使用文件关闭教程
下一篇
win11近期使用文件关闭教程
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 笔灵AI生成答辩PPT:高效制作学术与职场PPT的利器
    笔灵AI生成答辩PPT
    探索笔灵AI生成答辩PPT的强大功能,快速制作高质量答辩PPT。精准内容提取、多样模板匹配、数据可视化、配套自述稿生成,让您的学术和职场展示更加专业与高效。
    24次使用
  • 知网AIGC检测服务系统:精准识别学术文本中的AI生成内容
    知网AIGC检测服务系统
    知网AIGC检测服务系统,专注于检测学术文本中的疑似AI生成内容。依托知网海量高质量文献资源,结合先进的“知识增强AIGC检测技术”,系统能够从语言模式和语义逻辑两方面精准识别AI生成内容,适用于学术研究、教育和企业领域,确保文本的真实性和原创性。
    38次使用
  • AIGC检测服务:AIbiye助力确保论文原创性
    AIGC检测-Aibiye
    AIbiye官网推出的AIGC检测服务,专注于检测ChatGPT、Gemini、Claude等AIGC工具生成的文本,帮助用户确保论文的原创性和学术规范。支持txt和doc(x)格式,检测范围为论文正文,提供高准确性和便捷的用户体验。
    38次使用
  • 易笔AI论文平台:快速生成高质量学术论文的利器
    易笔AI论文
    易笔AI论文平台提供自动写作、格式校对、查重检测等功能,支持多种学术领域的论文生成。价格优惠,界面友好,操作简便,适用于学术研究者、学生及论文辅导机构。
    50次使用
  • 笔启AI论文写作平台:多类型论文生成与多语言支持
    笔启AI论文写作平台
    笔启AI论文写作平台提供多类型论文生成服务,支持多语言写作,满足学术研究者、学生和职场人士的需求。平台采用AI 4.0版本,确保论文质量和原创性,并提供查重保障和隐私保护。
    41次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码