Pattern for periodically fetching data from an external system

Assume I have a Django application with the following features:

there’s a Project model which has a created_at field
the application supports a plugin system where a developer can create custom API endpoint and install them onto the application, exposing them publicly. The endpoints can run arbitrary code, but cannot schedule long running tasks (e.g. Celery tasks)

My goal is to create a third party analytics service for this application. In order to do that, the analytics service needs to poll the application for new data periodically. Specifically, the analytics application needs to fetch any new projects.

The first step is to create a plugin that will act as an “adapter”, which exposes an API endpoint that presents the projects in a format that is useful to the analytics service. We have full control over this endpoint, which parameters it accepts, etc. Assume it answers using pagination.

Now the question is: assuming the analytics service will perform one request per hour to get the new projects, what should be the pattern to only ask for new projects?

There are two techniques which I’ve thought of, both with their advantages and disadvantages.

Use a query parameter since specifying the timestamp of the last time the analytics service fetched the project. The analytics app will run in a loop to get all the pages from the adapter endpoint, then will save the current time as the last timestamp. The pro is that this is a very simple approach. The main con is that any projects created during the retrieval of the pages may never make it to the analytics
Specifying the list of project IDs the analytics has already fetched in the request body / query params. This prevents starvation but will eventually get to the point where the requests are huge.

Is there a better way?

Trang chủ Giới thiệu Sinh nhật bé trai Sinh nhật bé gái Tổ chức sự kiện Biểu diễn giải trí Dịch vụ khác Trang trí tiệc cưới Tổ chức khai trương Tư vấn dịch vụ Thư viện ảnh Tin tức - sự kiện Liên hệ Chú hề sinh nhật Trang trí YEAR END PARTY công ty Trang trí tất niên cuối năm Trang trí tất niên xu hướng mới nhất Trang trí sinh nhật bé trai Hải Đăng Trang trí sinh nhật bé Khánh Vân Trang trí sinh nhật Bích Ngân Trang trí sinh nhật bé Thanh Trang Thuê ông già Noel phát quà Biểu diễn xiếc khỉ Xiếc quay đĩa Dịch vụ tổ chức sự kiện 5 sao Thông tin về chúng tôi Dịch vụ sinh nhật bé trai Dịch vụ sinh nhật bé gái Sự kiện trọn gói Các tiết mục giải trí Dịch vụ bổ trợ Tiệc cưới sang trọng Dịch vụ khai trương Tư vấn tổ chức sự kiện Hình ảnh sự kiện Cập nhật tin tức Liên hệ ngay Thuê chú hề chuyên nghiệp Tiệc tất niên cho công ty Trang trí tiệc cuối năm Tiệc tất niên độc đáo Sinh nhật bé Hải Đăng Sinh nhật đáng yêu bé Khánh Vân Sinh nhật sang trọng Bích Ngân Tiệc sinh nhật bé Thanh Trang Dịch vụ ông già Noel Xiếc thú vui nhộn Biểu diễn xiếc quay đĩa Dịch vụ tổ chức tiệc uy tín Khám phá dịch vụ của chúng tôi Tiệc sinh nhật cho bé trai Trang trí tiệc cho bé gái Gói sự kiện chuyên nghiệp Chương trình giải trí hấp dẫn Dịch vụ hỗ trợ sự kiện Trang trí tiệc cưới đẹp Khởi đầu thành công với khai trương Chuyên gia tư vấn sự kiện Xem ảnh các sự kiện đẹp Tin mới về sự kiện Kết nối với đội ngũ chuyên gia Chú hề vui nhộn cho tiệc sinh nhật Ý tưởng tiệc cuối năm Tất niên độc đáo Trang trí tiệc hiện đại Tổ chức sinh nhật cho Hải Đăng Sinh nhật độc quyền Khánh Vân Phong cách tiệc Bích Ngân Trang trí tiệc bé Thanh Trang Thuê dịch vụ ông già Noel chuyên nghiệp Xem xiếc khỉ đặc sắc Xiếc quay đĩa thú vị

Filed under: Kiến thức lập trình - @ 12:32

Thẻ: djangomicroservices

Thiết kế website giá rẻ

Danh mục

Pattern for periodically fetching data from an external system