请问像TITAN V、RTX3090这些显卡有没有规定CUDA编程时一个线程内可分配的存储在寄存器上的变量最多占多大内存呢?
我猜想你的问题的意思是每个线程可以最多使用多少个4B的常规寄存器?根据手册,你指出的两款卡都是可以使用255个的。但是你的提问方式“寄存器上的变量占用多大内存?”的确很令人费解。