Result for UniformSampleCone, z

Specification

\[\left(\left(2.328306437 \cdot 10^{-10} \leq ux \land ux \leq 1\right) \land \left(2.328306437 \cdot 10^{-10} \leq uy \land uy \leq 1\right)\right) \land \left(0 \leq maxCos \land maxCos \leq 1\right)\]

\[\left(1 - ux\right) + ux \cdot maxCos \]

(FPCore (ux uy maxCos)
  :precision binary32
  :pre (and (and (and (<= 2.328306437e-10 ux) (<= ux 1.0))
          (and (<= 2.328306437e-10 uy) (<= uy 1.0)))
     (and (<= 0.0 maxCos) (<= maxCos 1.0)))
  (+ (- 1.0 ux) (* ux maxCos)))

float code(float ux, float uy, float maxCos) {
	return (1.0f - ux) + (ux * maxCos);
}

real(4) function code(ux, uy, maxcos)
use fmin_fmax_functions
    real(4), intent (in) :: ux
    real(4), intent (in) :: uy
    real(4), intent (in) :: maxcos
    code = (1.0e0 - ux) + (ux * maxcos)
end function

function code(ux, uy, maxCos)
	return Float32(Float32(Float32(1.0) - ux) + Float32(ux * maxCos))
end

function tmp = code(ux, uy, maxCos)
	tmp = (single(1.0) - ux) + (ux * maxCos);
end

\left(1 - ux\right) + ux \cdot maxCos

Initial Program: 99.9% accurate, 1.0× speedup?

\[\left(1 - ux\right) + ux \cdot maxCos \]

(FPCore (ux uy maxCos)
  :precision binary32
  :pre (and (and (and (<= 2.328306437e-10 ux) (<= ux 1.0))
          (and (<= 2.328306437e-10 uy) (<= uy 1.0)))
     (and (<= 0.0 maxCos) (<= maxCos 1.0)))
  (+ (- 1.0 ux) (* ux maxCos)))

float code(float ux, float uy, float maxCos) {
	return (1.0f - ux) + (ux * maxCos);
}

real(4) function code(ux, uy, maxcos)
use fmin_fmax_functions
    real(4), intent (in) :: ux
    real(4), intent (in) :: uy
    real(4), intent (in) :: maxcos
    code = (1.0e0 - ux) + (ux * maxcos)
end function

function code(ux, uy, maxCos)
	return Float32(Float32(Float32(1.0) - ux) + Float32(ux * maxCos))
end

function tmp = code(ux, uy, maxCos)
	tmp = (single(1.0) - ux) + (ux * maxCos);
end

\left(1 - ux\right) + ux \cdot maxCos

Alternative 1: 99.9% accurate, 1.1× speedup?

\[\mathsf{fma}\left(ux, maxCos, 1 - ux\right) \]

(FPCore (ux uy maxCos)
  :precision binary32
  :pre (and (and (and (<= 2.328306437e-10 ux) (<= ux 1.0))
          (and (<= 2.328306437e-10 uy) (<= uy 1.0)))
     (and (<= 0.0 maxCos) (<= maxCos 1.0)))
  (fma ux maxCos (- 1.0 ux)))

float code(float ux, float uy, float maxCos) {
	return fmaf(ux, maxCos, (1.0f - ux));
}

function code(ux, uy, maxCos)
	return fma(ux, maxCos, Float32(Float32(1.0) - ux))
end

\mathsf{fma}\left(ux, maxCos, 1 - ux\right)

Derivation

Initial program 99.9%
\[\left(1 - ux\right) + ux \cdot maxCos \]
Step-by-step derivation
Applied rewrites99.9%
\[\leadsto \mathsf{fma}\left(ux, maxCos, 1 - ux\right) \]
Add Preprocessing

Alternative 2: 99.8% accurate, 1.1× speedup?

\[\mathsf{fma}\left(maxCos, ux, 1\right) - ux \]

(FPCore (ux uy maxCos)
  :precision binary32
  :pre (and (and (and (<= 2.328306437e-10 ux) (<= ux 1.0))
          (and (<= 2.328306437e-10 uy) (<= uy 1.0)))
     (and (<= 0.0 maxCos) (<= maxCos 1.0)))
  (- (fma maxCos ux 1.0) ux))

float code(float ux, float uy, float maxCos) {
	return fmaf(maxCos, ux, 1.0f) - ux;
}

function code(ux, uy, maxCos)
	return Float32(fma(maxCos, ux, Float32(1.0)) - ux)
end

\mathsf{fma}\left(maxCos, ux, 1\right) - ux

Derivation

Initial program 99.9%
\[\left(1 - ux\right) + ux \cdot maxCos \]
Step-by-step derivation
Applied rewrites99.8%
\[\leadsto \mathsf{fma}\left(maxCos, ux, 1\right) - ux \]
Add Preprocessing

Alternative 3: 98.1% accurate, 2.6× speedup?

\[1 - ux \]

(FPCore (ux uy maxCos)
  :precision binary32
  :pre (and (and (and (<= 2.328306437e-10 ux) (<= ux 1.0))
          (and (<= 2.328306437e-10 uy) (<= uy 1.0)))
     (and (<= 0.0 maxCos) (<= maxCos 1.0)))
  (- 1.0 ux))

float code(float ux, float uy, float maxCos) {
	return 1.0f - ux;
}

real(4) function code(ux, uy, maxcos)
use fmin_fmax_functions
    real(4), intent (in) :: ux
    real(4), intent (in) :: uy
    real(4), intent (in) :: maxcos
    code = 1.0e0 - ux
end function

function code(ux, uy, maxCos)
	return Float32(Float32(1.0) - ux)
end

function tmp = code(ux, uy, maxCos)
	tmp = single(1.0) - ux;
end

1 - ux

Derivation

Initial program 99.9%
\[\left(1 - ux\right) + ux \cdot maxCos \]
Taylor expanded in maxCos around 0
\[\leadsto 1 - ux \]
Step-by-step derivation
Applied rewrites98.1%
\[\leadsto 1 - ux \]
Add Preprocessing

Alternative 4: 71.3% accurate, 9.2× speedup?

\[1 \]

(FPCore (ux uy maxCos)
  :precision binary32
  :pre (and (and (and (<= 2.328306437e-10 ux) (<= ux 1.0))
          (and (<= 2.328306437e-10 uy) (<= uy 1.0)))
     (and (<= 0.0 maxCos) (<= maxCos 1.0)))
  1.0)

float code(float ux, float uy, float maxCos) {
	return 1.0f;
}

real(4) function code(ux, uy, maxcos)
use fmin_fmax_functions
    real(4), intent (in) :: ux
    real(4), intent (in) :: uy
    real(4), intent (in) :: maxcos
    code = 1.0e0
end function

function code(ux, uy, maxCos)
	return Float32(1.0)
end

function tmp = code(ux, uy, maxCos)
	tmp = single(1.0);
end

Derivation

Initial program 99.9%
\[\left(1 - ux\right) + ux \cdot maxCos \]
Taylor expanded in maxCos around 0
\[\leadsto 1 - ux \]
Step-by-step derivation
Applied rewrites98.1%
\[\leadsto 1 - ux \]
Taylor expanded in ux around 0
\[\leadsto 1 \]
Step-by-step derivation
Applied rewrites71.3%
\[\leadsto 1 \]
Add Preprocessing

Reproduce

herbie shell --seed 2025359 
(FPCore (ux uy maxCos)
  :name "UniformSampleCone, z"
  :precision binary32
  :pre (and (and (and (<= 2.328306437e-10 ux) (<= ux 1.0)) (and (<= 2.328306437e-10 uy) (<= uy 1.0))) (and (<= 0.0 maxCos) (<= maxCos 1.0)))
  (+ (- 1.0 ux) (* ux maxCos)))

UniformSampleCone, z

Specification

Local Percentage Accuracy vs ?

Accuracy vs Speed?

Initial Program: 99.9% accurate, 1.0× speedup?

Alternative 1: 99.9% accurate, 1.1× speedup?

Alternative 2: 99.8% accurate, 1.1× speedup?

Alternative 3: 98.1% accurate, 2.6× speedup?

Alternative 4: 71.3% accurate, 9.2× speedup?

Reproduce

Specification

Local Percentage Accuracy vs ?

Accuracy vs Speed?

Initial Program: 99.9% accurate, 1.0× speedupMathFPCoreCFortranJuliaMATLABTeX?

Alternative 1: 99.9% accurate, 1.1× speedupMathFPCoreCJuliaTeX?

Alternative 2: 99.8% accurate, 1.1× speedupMathFPCoreCJuliaTeX?

Alternative 3: 98.1% accurate, 2.6× speedupMathFPCoreCFortranJuliaMATLABTeX?

Alternative 4: 71.3% accurate, 9.2× speedupMathFPCoreCFortranJuliaMATLABTeX?

Reproduce

Initial Program: 99.9% accurate, 1.0× speedup?

Alternative 1: 99.9% accurate, 1.1× speedup?

Alternative 2: 99.8% accurate, 1.1× speedup?

Alternative 3: 98.1% accurate, 2.6× speedup?

Alternative 4: 71.3% accurate, 9.2× speedup?