Add sync/async executors for infer request

2025-08-06 14:36:36 +08:00 · 2022-09-29 09:47:53 +00:00 · 2022-09-29 09:47:53 +00:00 · 2af0813634
commit 2af0813634
parent 15d2a5faf8
1 changed files with 96 additions and 63 deletions
--- a/modules/gapi/src/backends/ie/giebackend.cpp
+++ b/modules/gapi/src/backends/ie/giebackend.cpp
@ -826,8 +826,10 @@ std::vector<InferenceEngine::InferRequest> cv::gimpl::ie::IECompiled::createInfe
    return requests;
 }
-class cv::gimpl::ie::RequestPool {
+class IInferExecutor {
 public:
    using Ptr             = std::shared_ptr<IInferExecutor>;
    using NotifyCallbackF = std::function<void()>;
    using SetInputDataF   = std::function<void(InferenceEngine::InferRequest&)>;
    using ReadOutputDataF = std::function<void(InferenceEngine::InferRequest&, InferenceEngine::StatusCode)>;
@ -839,37 +841,102 @@ public:
        ReadOutputDataF read_output_data;
    };
-    explicit RequestPool(std::vector<InferenceEngine::InferRequest>&& requests);
+    IInferExecutor(IE::InferRequest request, NotifyCallbackF notify)
        : m_request(std::move(request)),
          m_notify(std::move(notify)) {
    };
-    void execute(Task&& t);
+    virtual void execute(const Task& task) = 0;
-    void waitAll();
+    virtual ~IInferExecutor() = default;
 protected:
    IE::InferRequest m_request;
    NotifyCallbackF  m_notify;
 };
 class SyncInferExecutor : public IInferExecutor {
    using IInferExecutor::IInferExecutor;
    virtual void execute(const IInferExecutor::Task& task) override;
 };
 void SyncInferExecutor::execute(const IInferExecutor::Task& task) {
    try {
        task.set_input_data(m_request);
        m_request.Infer();
        task.read_output_data(m_request, IE::StatusCode::OK);
    } catch (...) {
        m_notify();
        throw;
    }
    // NB: Notify pool that executor has finished.
    m_notify();
 }
 class AsyncInferExecutor : public IInferExecutor {
 public:
    using IInferExecutor::IInferExecutor;
    virtual void execute(const IInferExecutor::Task& task) override;
 private:
    void callback(Task task,
                  size_t id,
                  IE::InferRequest request,
                  IE::StatusCode code) noexcept;
    void setup();
    void releaseRequest(const int id);
    QueueClass<size_t>                         m_idle_ids;
    std::vector<InferenceEngine::InferRequest> m_requests;
    bool                                       m_use_sync_api = false;
 };
-void cv::gimpl::ie::RequestPool::releaseRequest(const int id) {
+void AsyncInferExecutor::execute(const IInferExecutor::Task& task) {
-    if (!m_use_sync_api) {
+    using namespace std::placeholders;
-        auto& request = m_requests[id];
+    using callback_t = std::function<void(IE::InferRequest, IE::StatusCode)>;
-        request.SetCompletionCallback([](){});
+    m_request.SetCompletionCallback(
            static_cast<callback_t>(
                std::bind(&AsyncInferExecutor::callback, this, task, _1, _2)));
    try {
        task.set_input_data(m_request);
        m_request.StartAsync();
    } catch (...) {
        m_request.SetCompletionCallback([](){});
        m_notify();
        throw;
    }
 }
 void AsyncInferExecutor::callback(IInferExecutor::Task task,
                                  IE::InferRequest     request,
                                  IE::StatusCode       code) noexcept {
    task.read_output_data(request, code);
    request.SetCompletionCallback([](){});
    // NB: Notify pool that executor has finished.
    m_notify();
 }
 class cv::gimpl::ie::RequestPool {
 public:
    explicit RequestPool(std::vector<InferenceEngine::InferRequest>&& requests);
    IInferExecutor::Ptr getIdleRequest();
    void waitAll();
 private:
    void setup();
    void release(const int id);
    QueueClass<size_t>               m_idle_ids;
    std::vector<IInferExecutor::Ptr> m_requests;
 };
 void cv::gimpl::ie::RequestPool::release(const int id) {
    m_idle_ids.push(id);
 }
 // RequestPool implementation //////////////////////////////////////////////
-cv::gimpl::ie::RequestPool::RequestPool(std::vector<InferenceEngine::InferRequest>&& requests)
+cv::gimpl::ie::RequestPool::RequestPool(std::vector<InferenceEngine::InferRequest>&& requests) {
-    : m_requests(std::move(requests)) {
+    for (size_t i = 0; i < requests.size(); ++i) {
-        setup();
+        m_requests.emplace_back(
                std::make_shared<AsyncInferExecutor>(std::move(requests[0]),
                                                     std::bind(&RequestPool::release, this, i)));
    }
    setup();
 }
 void cv::gimpl::ie::RequestPool::setup() {
    for (size_t i = 0; i < m_requests.size(); ++i) {
@ -877,44 +944,10 @@ void cv::gimpl::ie::RequestPool::setup() {
    }
 }
-void cv::gimpl::ie::RequestPool::execute(cv::gimpl::ie::RequestPool::Task&& task) {
+IInferExecutor::Ptr cv::gimpl::ie::RequestPool::getIdleRequest() {
    size_t id = 0u;
    m_idle_ids.pop(id);
-    auto& request = m_requests[id];
+    return m_requests[id];
    try {
        task.set_input_data(request);
        if (m_use_sync_api) {
            request.Infer();
            task.read_output_data(request, IE::StatusCode::OK);
            releaseRequest(id);
        } else {
            using namespace std::placeholders;
            using callback_t = std::function<void(IE::InferRequest, IE::StatusCode)>;
            request.SetCompletionCallback(
                    static_cast<callback_t>(
                        std::bind(&cv::gimpl::ie::RequestPool::callback, this,
                                  task, id, _1, _2)));
            request.StartAsync();
        }
    } catch (...) {
        // NB: InferRequest is already marked as busy
        // in case of exception need to return it back to the idle.
        releaseRequest(id);
        throw;
    }
 }
 void cv::gimpl::ie::RequestPool::callback(cv::gimpl::ie::RequestPool::Task task,
                                          size_t id,
                                          IE::InferRequest request,
                                          IE::StatusCode code) noexcept {
    // NB: Inference is over.
    // 1. Run callback
    // 2. Destroy callback to free resources.
    // 3. Mark InferRequest as idle.
    task.read_output_data(request, code);
    releaseRequest(id);
 }
 // NB: Not thread-safe.
@ -1330,8 +1363,8 @@ struct Infer: public cv::detail::KernelTag {
    static void run(std::shared_ptr<IECallContext>  ctx,
                    cv::gimpl::ie::RequestPool     &reqPool) {
        using namespace std::placeholders;
-        reqPool.execute(
+        reqPool.getIdleRequest()->execute(
-                cv::gimpl::ie::RequestPool::Task {
+                IInferExecutor::Task {
                    [ctx](InferenceEngine::InferRequest &req) {
                        // non-generic version for now:
                        // - assumes all inputs/outputs are always Mats
@ -1440,8 +1473,8 @@ struct InferROI: public cv::detail::KernelTag {
    static void run(std::shared_ptr<IECallContext>  ctx,
                    cv::gimpl::ie::RequestPool     &reqPool) {
        using namespace std::placeholders;
-        reqPool.execute(
+        reqPool.getIdleRequest()->execute(
-                cv::gimpl::ie::RequestPool::Task {
+                IInferExecutor::Task {
                    [ctx](InferenceEngine::InferRequest &req) {
                        GAPI_Assert(ctx->uu.params.num_in == 1);
                        auto&& this_roi = ctx->inArg<cv::detail::OpaqueRef>(0).rref<cv::Rect>();
@ -1579,8 +1612,8 @@ struct InferList: public cv::detail::KernelTag {
        for (auto&& it : ade::util::indexed(in_roi_vec)) {
                  auto  pos = ade::util::index(it);
            const auto& rc  = ade::util::value(it);
-            reqPool.execute(
+            reqPool.getIdleRequest()->execute(
-                cv::gimpl::ie::RequestPool::Task {
+                IInferExecutor::Task {
                    [ctx, rc, this_blob](InferenceEngine::InferRequest &req) {
                        setROIBlob(req, ctx->uu.params.input_names[0u], this_blob, rc, *ctx);
                    },
@ -1734,8 +1767,8 @@ struct InferList2: public cv::detail::KernelTag {
        PostOutputsList callback(list_size, ctx, std::move(cached_dims));
        for (const auto &list_idx : ade::util::iota(list_size)) {
-            reqPool.execute(
+            reqPool.getIdleRequest()->execute(
-                cv::gimpl::ie::RequestPool::Task {
+                IInferExecutor::Task {
                    [ctx, list_idx, list_size, blob_0](InferenceEngine::InferRequest &req) {
                        for (auto in_idx : ade::util::iota(ctx->uu.params.num_in)) {
                            const auto &this_vec = ctx->inArg<cv::detail::VectorRef>(in_idx+1u);