За счет оффлоада он просто не попадет на ЦПУ этого устройства, но чтобы попасть/улететь на другое устройство, должна произойти коммутация. Т.е. по одну сторону асика будет медленная коммутация с ЦПУ, но по другую - должна быть быстрая коммутация с другим устройством, верно?
Не, это имеет смысл при большой таблице маршрутизации, когда стоимость приёма на коммутации меньше чем решение о маршрутизации. В принципе тут можно примерно представить full view dual stack таблички и софтовую обработку коммутации на интерфейсах