首页 > 其他分享 >统计开始目录及其子目录下的指定类型文件中的单词(使用多线程、并发多线程(mappedReduced函数)进行速度对比)

统计开始目录及其子目录下的指定类型文件中的单词(使用多线程、并发多线程(mappedReduced函数)进行速度对比)

时间:2022-11-12 08:33:30浏览次数:52  
标签:files include const mappedReduced 子目录 WordCount QString qDebug 多线程


#include <QList>
#include <QMap>
#include <QTextStream>
#include <QString>
#include <QStringList>
#include <QDir>
#include <QElapsedTimer>
#include <QApplication>
#include <QDebug>

#include <QtConcurrent>

using namespace QtConcurrent;

/*  功能:
    Utility function that recursivily searches for files.
    递归查找指定目录及其所有子目录下的指定后缀的文件(*.h、*.cpp)。
*/
QStringList findFiles(const QString &startDir, const QStringList &filters)
{
    QStringList names;
    QDir dir(startDir);

    //! 指定的开始目录
    const auto files = dir.entryList(filters, QDir::Files);
    if (files.count() > 0) {
        for (const QString &file : files)
            names += startDir + '/' + file;
    }

    //! 所有子目录
    const auto subdirs =  dir.entryList(QDir::AllDirs | QDir::NoDotAndDotDot);
    if (subdirs.count() > 0) {
        for (const QString &subdir : subdirs)
            names += findFiles(startDir + '/' + subdir, filters);
    }

    return names;
}

typedef QMap<QString, int> WordCount;

/*
    Single threaded word counter function.
*/
WordCount singleThreadedWordCount(const QStringList &files)
{
    WordCount wordCount;
    for (const QString &file : files) {
        QFile f(file);
        f.open(QIODevice::ReadOnly);
        QTextStream textStream(&f);
        while (!textStream.atEnd()) {
            const auto words =  textStream.readLine().split(' ');
            for (const QString &word : words)
                wordCount[word] += 1;
        }//while
    }//for
    return wordCount;
}


// countWords counts the words in a single file.
// This function is called in parallel by several threads
// and must be thread safe.
WordCount countWords(const QString &file)
{
    QFile f(file);
    f.open(QIODevice::ReadOnly);
    QTextStream textStream(&f);
    WordCount wordCount;

    while (!textStream.atEnd()) {
        const auto words =  textStream.readLine().split(' ');
        for (const QString &word : words)
            wordCount[word] += 1;
    }//while

    return wordCount;
}

// reduce adds the results from map to the final
// result. This functor will only be called by one thread
// at a time.
void reduce(WordCount &result, const WordCount &w)
{
    for (auto i = w.begin(), end = w.end(); i != end; ++i)
        result[i.key()] += i.value();
}

int main(int argc, char** argv)
{
    QApplication app(argc, argv);

    qDebug() << "finding files...";
    QStringList files = findFiles("../../", QStringList() << "*.cpp" << "*.h");
    qDebug() << files.count() << "files";

    qDebug() << "warmup";
    {
        WordCount total = singleThreadedWordCount(files);
    }

    qDebug() << "warmup done";

    int singleThreadTime = 0;
    {
        QElapsedTimer timer;
        timer.start();
        WordCount total = singleThreadedWordCount(files);
        singleThreadTime = timer.elapsed();
        qDebug() << "single thread" << singleThreadTime;
    }

    int mapReduceTime = 0;
    {
        QElapsedTimer timer;
        timer.start();
        WordCount total = mappedReduced(files, countWords, reduce).result();
        mapReduceTime = timer.elapsed();
        qDebug() << "MapReduce" << mapReduceTime;
    }
    qDebug() << "MapReduce speedup x" << ((double)singleThreadTime - (double)mapReduceTime) / (double)mapReduceTime + 1;
}

标签:files,include,const,mappedReduced,子目录,WordCount,QString,qDebug,多线程
From: https://www.cnblogs.com/zdt168/p/16882658.html

相关文章

  • Java静态代理设计模式模式(多线程Runnable)
    静态代理设计模式,就是代理对象来帮你忙前忙后,你负责出席一下就好了。需要:1.实现相同的接口2.真实角色3.代理角色,里面有一个成员是接口对象(实际上是真实角色----接口实......
  • 【Java】多线程 语法 使用
    在java中使用多线程有三种方式。1.继承Thread类;2.实现Runnable接口;3.匿名内部类;第一种一般不用,因为java只允许单继承,万一这个业务类有父类就无法继承了。第二种如下:publicc......
  • 【转】多线程下的fork及写时复制导致的性能问题
    名词解释PHPvsHHVM:PHP指的是​​php.net(Zend)​​​实现的PHP,而HHVM指的是​​Facebook开源的PHP实现​​。PHP-FPM:(PHPFastcgiProcessManager)一个PHPSapi实现......
  • 【Java】多线程 数目
    今天看到一篇文章,讲多线程数目的,很棒这个问题还是很容易被忽略的,就是多线程到底是为了什么?最开始学习多线程的时候,往往将多线程和性能高划等号,只要用了多线程就能提升性能,其......
  • 读者-写者(多线程)
    1.描述操作系统中“读者-写者”问题,理解问题的本质,提交你理解或查找到的文本资料问题描述:多个进程访问一个共享的数据区读者(读进程)只能读数据,写者(写进程)只能写数据......
  • Java多线程 CompletionService和ExecutorCompletionService
    目录​​一、说明​​​​二、理解​​​​三、实现​​​​1.使用Future​​​​2.使用ExecutorCompletionService​​​​3.take()方法​​​​4.poll()方法​​​​5.pol......
  • Java多线程 Callable和Future
    目录​​一、说明​​​​二、理解​​​​三、实现​​​​1.实现接口​​​​2.执行线程​​一、说明Java提供了三种创建线程的方法实现​​Runnable​​接口继承​​T......
  • Java多线程 Future和FutureTask的区别
    目录​​一、说明​​​​二、理解​​​​三、实现​​​​1.实现接口​​​​2.使用Future​​​​3.使用FutureTask​​一、说明Future和FutureTask的关系Future是一个......
  • Java多线程 ThreadPoolExecutor-RejectedExecutionHandler拒绝执行策略
    目录​​一、说明​​​​二、理解​​​​三、实现​​​​1.AbortPolicy​​​​2.DiscardPolicy​​​​3.DiscardOldestPolicy​​​​4.CallerRunsPolicy​​​​5.自......
  • Java多线程 线程池Executor框架
    目录​​一、说明​​​​二、理解​​​​Executor​​​​ExecutorService​​​​Executors​​​​三、实现​​​​1.newSingleThreadExecutor​​​​2.newFixedThr......