Возможно ли вмешаться в работу планировщика исполнения варпов в мультипроцессоре?
Это нужно для ускорения алгоритма, в котором есть зависимость от порядка исполнения. Заданная последовательность исполнения варпов позволяет избегать ряда проверок и синхронизаций, что дает очень простой код.
CUDA по умалчиванию дает именно ту последовательность исполнения, где алгоритм работает корректно. Как обеспечить гарантию этого?
Возможно ли вмешаться в работу планировщика исполнения варпов в мультипроцессоре?
Это нужно для ускорения алгоритма, в котором есть зависимость от порядка исполнения. Заданная последовательность исполнения варпов позволяет избегать ряда проверок и синхронизаций, что дает очень простой код.
CUDA по умалчиванию дает именно ту последовательность исполнения, где алгоритм работает корректно. Как обеспечить гарантию этого?