محدودیت نرخ مبتنی بر IP
استفاده از یک محدودکننده نرخ سراسری زمانی مفید است که بخواهید یک محدودیت دقیق روی کل نرخ درخواستها به API خود اعمال کنید و برایتان مهم نباشد که درخواستها از کجا میآیند. اما معمولاً رایجتر این است که برای هر کلاینت یک محدودکننده نرخ جداگانه داشته باشیم، به طوری که یک کلایtent بد که درخواستهای زیادی ارسال میکند، روی بقیه تأثیر نگذارد.
یک راه ساده و منطقی برای پیادهسازی این کار، ایجاد یک نقشه از محدودکنندههای نرخ در حافظه است که از آدرس IP هر کلاینت به عنوان کلید نقشه استفاده میکند.
هر بار که یک کلاینت جدید درخواستی به API ما ارسال میکند، یک محدودکننده نرخ جدید مقداردهی اولیه کرده و آن را به نقشه اضافه میکنیم. برای درخواستهای بعدی، محدودکننده نرخ کلاینت را از نقشه بازیابی کرده و بررسی میکنیم که آیا درخواست با فراخوانی متد Allow() آن مجاز است یا خیر، دقیقاً مانند قبل.
اما یک نکته وجود دارد که باید به آن توجه کرد: به طور پیشفرض، نقشهها برای استفاده همزمان ایمن نیستند. این برای ما یک مشکل است زیرا میانافزار rateLimit() ما ممکن است در چندین goroutine به طور همزمان اجرا شود (به یاد داشته باشید که http.Server در Go هر درخواست HTTP را در goroutine خاص خودش مدیریت میکند).
از وبلاگ Go:
نقشهها برای استفاده همزمان ایمن نیستند: تعریف نشده است که چه اتفاقی میافتد وقتی همزمان از آنها بخوانید و در آنها بنویسید. اگر نیاز دارید از یک نقشه همزمان از goroutineهای مختلف بخوانید و در آن بنویسید، دسترسیها باید توسط نوعی سازگاریسازی مدیریت شوند.
بنابراین برای حل این مشکل، باید دسترسی به نقشه محدودکنندههای نرخ را با استفاده از یک sync.Mutex (قفل انحصاری متقابل) هماهنگ کنیم، به طوری که فقط یک goroutine بتواند در هر لحظه از نقشه بخواند یا در آن بنویسد.
حالا بیایید درباره آدرسهای IP صحبت کنیم.
فیلد r.RemoteAddr درخواست باید حاوی آدرس IP کلاینتی باشد که درخواست را ارسال کرده است. اما… در دنیای واقعی ممکن است سرورهای پروکسی بین برنامه شما و کلاینت قرار داشته باشند، به این معنی که آدرس IP ذخیره شده در r.RemoteAddr ممکن است در واقع آدرس IP واقعی کلاینت اصلی نباشد — در عوض ممکن است آدرس IP یک پروکسی باشد.
پروکسیهای خوشرفتار معمولاً هدر X-Forwarded-For یا X-Real-IP را به درخواست اضافه میکنند که حاوی IP کلاینت اصلی است. بنابراین میتوانیم شانس دریافت IP واقعی کلاینت را با بررسی این هدرها و — اگر وجود داشته باشند — استفاده از آدرس IP از آنها افزایش دهیم.
اگرچه میتوانیم منطق این کار را خودمان بنویسیم، توصیه میکنم از پکیج realip استفاده کنیم. این پکیج بسیار کوچک است و به سادگی آدرس IP کلاینت را از هدرهای X-Forwarded-For یا X-Real-IP بازیابی میکند و در صورت عدم وجود هر دو، از r.RemoteAddr استفاده میکند.
اگر میخواهید همراه با ما پیش بروید، نسخه آخر realip را با دستور go get نصب کنید:
$ go get github.com/tomasen/realip@latest go: downloading github.com/tomasen/realip v0.0.0-20180522021738-f0c99a92ddce go get: added github.com/tomasen/realip v0.0.0-20180522021738-f0c99a92ddce
خب، با تمام شدن تنظیمات، بیایید به کد بپردازیم و میانافزار rateLimit() خود را برای پیادهسازی تغییرات بهروزرسانی کنیم.
package main import ( "fmt" "net" // New import "net/http" "sync" // New import "github.com/tomasen/realip" // New import "golang.org/x/time/rate" ) ... func (app *application) rateLimit(next http.Handler) http.Handler { // Declare a mutex and a map to hold the clients' IP addresses and rate limiters. var ( mu sync.Mutex clients = make(map[string]*rate.Limiter) ) return http.HandlerFunc(func(w http.ResponseWriter, r *http.Request) { // Use the realip.FromRequest() function to get the client's IP address. ip := realip.FromRequest(r) // Lock the mutex to prevent this code from being executed concurrently. mu.Lock() // Check to see if the IP address already exists in the map. If it doesn't, then // initialize a new rate limiter and add the IP address and limiter to the map. if _, found := clients[ip]; !found { clients[ip] = rate.NewLimiter(2, 4) } // Call the Allow() method on the rate limiter for the current IP address. If // the request isn't allowed, unlock the mutex and send a 429 Too Many Requests // response, just like before. if !clients[ip].Allow() { mu.Unlock() app.rateLimitExceededResponse(w, r) return } // Very importantly, unlock the mutex before calling the next handler in the // chain. Notice that we DON'T use defer to unlock the mutex, as that would mean // that the mutex isn't unlocked until all the handlers downstream of this // middleware have also returned. mu.Unlock() next.ServeHTTP(w, r) }) }
حذف محدودکنندههای قدیمی
کد بالا کار میکند، اما یک مشکل جزئی وجود دارد — نقشه clients به طور نامحدود رشد میکند و با هر آدرس IP و محدودکننده نرخ جدیدی که اضافه میکنیم، منابع بیشتری مصرف میشود.
برای جلوگیری از این مشکل، بیایید کد خود را بهروزرسانی کنیم تا زمان آخرین مشاهده هر کلاینت را نیز ثبت کنیم. سپس میتوانیم یک goroutine پسزمینه اجرا کنیم که به طور دورهای هر کلاینتی را که اخیراً مشاهده نشده از نقشه clients حذف میکند.
برای عملی کردن این کار، باید یک ساختار client سفارشی ایجاد کنیم که هم محدودکننده نرخ و هم زمان آخرین مشاهده هر کلاینت را نگه میدارد، و goroutine پاکسازی پسزمینه را هنگام مقداردهی اولیه میانافزار راهاندازی کنیم.
به این صورت:
package main import ( "fmt" "net" "net/http" "sync" "time" // New import "github.com/tomasen/realip" "golang.org/x/time/rate" ) ... func (app *application) rateLimit(next http.Handler) http.Handler { // Define a client struct to hold the rate limiter and last seen time for each // client. type client struct { limiter *rate.Limiter lastSeen time.Time } var ( mu sync.Mutex // Update the map so the values are pointers to a client struct. clients = make(map[string]*client) ) // Launch a background goroutine which removes old entries from the clients map once // every minute. go func() { for { time.Sleep(time.Minute) // Lock the mutex to prevent any rate limiter checks from happening while // the cleanup is taking place. mu.Lock() // Loop through all clients. If they haven't been seen within the last three // minutes, delete the corresponding entry from the map. for ip, client := range clients { if time.Since(client.lastSeen) > 3*time.Minute { delete(clients, ip) } } // Importantly, unlock the mutex when the cleanup is complete. mu.Unlock() } }() return http.HandlerFunc(func(w http.ResponseWriter, r *http.Request) { ip := realip.FromRequest(r) mu.Lock() if _, found := clients[ip]; !found { // Create and add a new client struct to the map if it doesn't already exist. clients[ip] = &client{limiter: rate.NewLimiter(2, 4)} } // Update the last seen time for the client. clients[ip].lastSeen = time.Now() if !clients[ip].limiter.Allow() { mu.Unlock() app.rateLimitExceededResponse(w, r) return } mu.Unlock() next.ServeHTTP(w, r) }) }
در این مرحله، اگر API را مجدداً راهاندازی کنید و دستهای از درخواستها را با سرعت زیاد مجدداً ارسال کنید، باید متوجه شوید که محدودکننده نرخ از دیدگاه یک کلاینت جداگانه همچنان به درستی کار میکند — دقیقاً مانند قبل.
$ for i in {1..6}; do curl http://localhost:4000/v1/healthcheck; done
{
"status": "available",
"system_info": {
"environment": "development",
"version": "1.0.0"
}
}
{
"status": "available",
"system_info": {
"environment": "development",
"version": "1.0.0"
}
}
{
"status": "available",
"system_info": {
"environment": "development",
"version": "1.0.0"
}
}
{
"status": "available",
"system_info": {
"environment": "development",
"version": "1.0.0"
}
}
{
"error": "rate limit exceeded"
}
{
"error": "rate limit exceeded"
}
اطلاعات تکمیلی
برنامههای توزیعشده
استفاده از این الگو برای محدودیت نرخ فقط زمانی کار میکند که برنامه API شما روی یک ماشین واحد اجرا شود. اگر زیرساخت شما توزیعشده باشد و برنامه شما روی چندین سرور پشت یک بالانسر بار اجرا شود، به رویکرد جایگزینی نیاز خواهید داشت.
اگر از HAProxy یا Nginx به عنوان بالانسر بار یا پروکسی معکوس استفاده میکنید، هر دوی اینها قابلیت داخلی برای محدودیت نرخ دارند که میتوانید از آن استفاده کنید. به عنوان جایگزین، میتوانید از یک پایگاه داده سریع مانند Redis برای نگهداری شمارنده درخواستها برای کلاینتها استفاده کنید که روی سروری اجرا میشود که تمام سرورهای برنامه شما میتوانند با آن ارتباط برقرار کنند.