ZLUDA/ptx/src/test/ll/mul_non_ftz.ll

define amdgpu_kernel void @mul_non_ftz(ptr addrspace(4) byref(i64) %"33", ptr addrspace(4) byref(i64) %"34") #0 {
  %"35" = alloca i64, align 8, addrspace(5)
  %"36" = alloca i64, align 8, addrspace(5)
  %"37" = alloca float, align 4, addrspace(5)
  %"38" = alloca float, align 4, addrspace(5)
  br label %1

1:                                                ; preds = %0
  br label %"32"

"32":                                             ; preds = %1
  %"39" = load i64, ptr addrspace(4) %"33", align 4
  store i64 %"39", ptr addrspace(5) %"35", align 4
  %"40" = load i64, ptr addrspace(4) %"34", align 4
  store i64 %"40", ptr addrspace(5) %"36", align 4
  %"42" = load i64, ptr addrspace(5) %"35", align 4
  %"50" = inttoptr i64 %"42" to ptr
  %"41" = load float, ptr %"50", align 4
  store float %"41", ptr addrspace(5) %"37", align 4
  %"43" = load i64, ptr addrspace(5) %"35", align 4
  %"51" = inttoptr i64 %"43" to ptr
  %"31" = getelementptr inbounds i8, ptr %"51", i64 4
  %"44" = load float, ptr %"31", align 4
  store float %"44", ptr addrspace(5) %"38", align 4
  %"46" = load float, ptr addrspace(5) %"37", align 4
  %"47" = load float, ptr addrspace(5) %"38", align 4
  %"45" = fmul float %"46", %"47"
  store float %"45", ptr addrspace(5) %"37", align 4
  %"48" = load i64, ptr addrspace(5) %"36", align 4
  %"49" = load float, ptr addrspace(5) %"37", align 4
  %"52" = inttoptr i64 %"48" to ptr
  store float %"49", ptr %"52", align 4
  ret void
}

attributes #0 = { "amdgpu-unsafe-fp-atomics"="true" "denormal-fp-math"="preserve-sign" "denormal-fp-math-f32"="ieee" "no-trapping-math"="true" "uniform-work-group-size"="true" }