ASP.NET Core中I/O阻塞与线程池爬山

分享
ASP.NET Core中I/O阻塞与线程池爬山

线程池爬山算法

  • CLR的线程池具有最小线程数最大线程数的限制,默认最小线程数为CPU的逻辑处理器数量,当同时使用的线程数超过最小线程数后,它以适中的速率(例如每秒1或2个)创建新的线程。这意味着当你的线程数超过最小线程数后,超出部分的线程创建请求则需要进行排队,且越后面的线程等待时间越长。
  • CLR设计默认线程池数量与CPU逻辑处理器数量相同是有原因的,两个好处:
    • 线程数过多的情况下,CPU需要在多个线程间进行切换,这会导致额外的线程切换开销,线程数越多则CPU大部分时间都花在了切换线程上下文上。
    • 如果某个方法是阻塞的,那么大量的请求进来会导致线程无限制的被创建,会瞬间消耗大量的内存。

Practice

  • 我们可以简单的创建一个NET Core Console程序进行验证
static void Main(string[] args)
{
    var processThreads = 0;
    while (true)
    {
        Task.Factory.StartNew(() =>
        {
            processThreads++;
            Console.WriteLine($"Currnet Thread Number:{processThreads}   CurrentDateTime:{DateTime.Now.ToString("yyyy-MM-dd HH:mm:ss:fff")}");
            Thread.Sleep(Timeout.Infinite);
        });
        //防止创建过多的等待线程
        Thread.Sleep(1);
    }
}

此程序每1毫秒创建一个新的线程去打印创建的线程数量以及时间信息。程序输出如下:

不难看出,前面8个线程是立即被创建的,当超过8个Worker Thread后,则会变成每1秒创建一个新线程。

如果我们在程序启动时设置最小线程数:

static void Main(string[] args)
{
    //读取最小线程数
    ThreadPool.GetMinThreads(out var _, out var minCompletionPortThreads);
    //设置最小线程数
    ThreadPool.SetMinThreads(50, minCompletionPortThreads);
    var processThreads = 0;
    while (true)
    {
        Task.Factory.StartNew(() =>
        {
            processThreads++;
            Console.WriteLine($"Currnet Thread Number:{processThreads}   CurrentDateTime:{DateTime.Now.ToString("yyyy-MM-dd HH:mm:ss:fff")}");
            Thread.Sleep(Timeout.Infinite);
        });
        //防止创建过多的等待线程
        Thread.Sleep(1);
    }
}

可以看到前50个线程是立即被创建的,从第51个线程开始每1秒创建一个新线程。

ASP.NET Core & Worker Threads

  • ASP.NET Core的每次请求都会占用一个Worker Thread,如果我们的最小线程数为8且并发10个请求,那么有8个请求将被立即处理,剩下两个请求则会被CLR限制线程的创建。
  • 如果在ASP.NET Core中的请求执行速度非常快,那么它将立即释放线程给后续请求使用,所以即使你上百的并发数量可能工作线程数量才十个甚至更少,但是如果你的请求时间很长,那么需要适当的设置最小线程数
  • 一般情况下,即使不设置最小线程数,当并发请求维持一定时间后不波动,线程池也能自动增长到能够维持并发的线程数量,但是在突然爆发的并发请求来临时,它将限制线程的创建速度。当并发突然停止时,CLR将维持这些线程在线程池中用于接下来的请求,但是当线程空闲时长超过一段时间后(可能是15秒),它们将被回收。

Workaround

  • 一个好的方式是采用异步编程,当处理耗时I/O绑定操作时,线程并未在此等待,当I/O操作完成时,线程再继续处理,这能够最大效率的使用线程(提高线程的利用率,减少等待情况)。
  • 但是业务系统往往不能立即做出良好的更改,我们可以使用ThreadPool.SetMinThreads()在程序启动时来设置最小线程数,这通常不是一个好的解决方案,不过它确实有效(增加线程的数量)。

Best Practice

  • 对于I/O绑定的操作,使用异步编程的方式编写非阻塞代码。
  • 对于CPU绑定的操作,使用Task.Run来运行多个任务。

Reference

阅读更多

以太坊黑暗森林-抢跑(front running)

以太坊黑暗森林-抢跑(front running)

前言 鸽了很久之后的今天突然心血来潮,准备写一个系列:以太坊黑暗森林,它介绍以太坊生态上的各种奇思妙想和逆天的攻击方式,会从简单的、常见的攻击方式开始介绍。取这个名字是因为我接触以太坊不久后看的一篇文章 Ethereum is a Dark Forest ,让我想起了《三体》小说中刘慈欣描述的黑暗森林,以太坊是一个弱肉强食的、没有规则的世界,猎人们总是躲在背后监听所有的交易,一旦发现猎物,它们会把它的血给吸干。 开盘抢币 相信进入以太坊生态的韭菜们,一定有过在 uniswap 上买刚开盘新币的经历,新开盘的币,一般会上涨几倍甚至十几倍,越早买入则越能低价买入。你守着时间,等着项目方添加流动性后第一时间买入代币,但是你发现,无论你的手速多块,总是看到一开盘,价格已经飚了几倍,你骂骂咧咧,开始不断拉高 gas 费用,尝试继续买入,但是你眼睁睁的看着代币涨到十倍,自己的交易却一直失败,你开始怀疑项目方自己抢跑,怀疑项目方捣鬼:肯定是项目方吃相难看,用老鼠仓提前买了。另一些聪明人,研究了以太坊的基本技术,他们在 ethscan

By FatTiger
C#:IDisposable 和 析构函数

C#:IDisposable 和 析构函数

C# 中有两种释放资源的方式:实现 IDisposable 或使用析构函数。通常,必须在特定时间释放资源的场景中,我们实现 IDisposable,像这样: public class ExampleDispose : IDisposable { // 非托管资源 private IntPtr _handle; // 使用的其它托管资源 private readonly Stream _stream; private bool disposed = false; public ExampleDispose(Stream stream, IntPtr handle) { this._stream = stream; this._handle = handle; } public void Dispose() { if (disposed) { return; } disposed = t

By FatTiger
ThreadLocal引发的灾难

ThreadLocal引发的灾难

在 Java 里有个称之为线程本地变量的类型叫做 ThreadLocal,它与 ThreadLocal 之于 C# 中是一样的作用,可以在线程范围内设置变量,这个变量只会在当前线程可被访问,但是它们有一点不同的是,在 Java 中,当你设置好变量后,在线程使用完毕回到线程池之前,需要手动调用 ThreadLocal.remove() 方法去清除线程本地变量,否则变量随着线程回到线程池,并且在下次使用此线程时此变量继续存在,而在 C# 中,线程回到线程池时会自动清除本地变量,因此无需手动去清除。 我们的业务有这样一个场景:某个业务 UserService 类中,具有多个方法会频繁(甚至循环)调用一个获取用户标签的接口,具体原因是因为某些方法会进行递归,数据结构有个树状结构,因此,为了优化接口响应时间以及看起来不那么蠢,我使用 ThreadLocal 将用户标签接口的返回数据存储到当前线程,因为在单个请求中,多次调用此接口获取数据是不必要的,它看起来像这样: /** * 此静态变量ThreadLocal会为每个线程创建本地副本, 因此USER_TAGS_THREAD_

By FatTiger
我在币安智能链的日子-区块链基础

我在币安智能链的日子-区块链基础

区块和链 无论是比特币还是以太坊,都是具有一个个区块(称之为Block)的链式结构,学过<数据结构>的肯定明白链表,区块链就像一个链表,每个区块都存储上一个区块哈希。 链(称之为Chain),有非常多的链,他们的协议不同,技术也不尽相同,比特币网络是一个链,以太坊网络是另一个链,每个链都有自己的目标(甚至目标只是为了圈钱),每个链也都有自己的代币,比特币网络的代币是比特币,每次交易都需要比特币作为手续费,以太坊网络代币是以太币,每次在以太坊网络的交易都需要以太币作为手续费。所以,链实际上作为基础设施,非常多的团队喜欢创建新的链,但是一个链光有网络光有代币不行,没有生态,很难成功。 币安智能链(Binance Smart Chain:BSC) 我的主要操作都是在BSC上,没有其它原因,只因为一个穷字。在BTC网络交易,需要BTC用作手续费,这个我可用不起,在以太坊(Ethereum)网络交易,需要以太币(ETH)作为用作手续费,按照以太币目前(

By FatTiger