Average Error: 0.3 → 0.3
Time: 23.9s
Precision: binary32
\[\left(\left(\left(\left(\left(-10000 \leq xi \land xi \leq 10000\right) \land \left(-10000 \leq yi \land yi \leq 10000\right)\right) \land \left(-10000 \leq zi \land zi \leq 10000\right)\right) \land \left(2.328306437 \cdot 10^{-10} \leq ux \land ux \leq 1\right)\right) \land \left(2.328306437 \cdot 10^{-10} \leq uy \land uy \leq 1\right)\right) \land \left(0 \leq maxCos \land maxCos \leq 1\right)\]
\[\left(\left(\cos \left(\left(uy \cdot 2\right) \cdot \pi\right) \cdot \sqrt{1 - \left(\left(\left(1 - ux\right) \cdot maxCos\right) \cdot ux\right) \cdot \left(\left(\left(1 - ux\right) \cdot maxCos\right) \cdot ux\right)}\right) \cdot xi + \left(\sin \left(\left(uy \cdot 2\right) \cdot \pi\right) \cdot \sqrt{1 - \left(\left(\left(1 - ux\right) \cdot maxCos\right) \cdot ux\right) \cdot \left(\left(\left(1 - ux\right) \cdot maxCos\right) \cdot ux\right)}\right) \cdot yi\right) + \left(\left(\left(1 - ux\right) \cdot maxCos\right) \cdot ux\right) \cdot zi \]
\[\begin{array}{l} t_0 := \left(uy \cdot 2\right) \cdot \pi\\ t_1 := \left(1 - ux\right) \cdot maxCos\\ \mathsf{fma}\left(ux, t_1 \cdot zi, \sqrt{\mathsf{fma}\left(ux, ux \cdot \left(t_1 \cdot \left(ux \cdot maxCos - maxCos\right)\right), 1\right)} \cdot \mathsf{fma}\left(\cos \left(\mathsf{expm1}\left(\mathsf{log1p}\left(t_0\right)\right)\right), xi, \sin t_0 \cdot yi\right)\right) \end{array} \]
\left(\left(\cos \left(\left(uy \cdot 2\right) \cdot \pi\right) \cdot \sqrt{1 - \left(\left(\left(1 - ux\right) \cdot maxCos\right) \cdot ux\right) \cdot \left(\left(\left(1 - ux\right) \cdot maxCos\right) \cdot ux\right)}\right) \cdot xi + \left(\sin \left(\left(uy \cdot 2\right) \cdot \pi\right) \cdot \sqrt{1 - \left(\left(\left(1 - ux\right) \cdot maxCos\right) \cdot ux\right) \cdot \left(\left(\left(1 - ux\right) \cdot maxCos\right) \cdot ux\right)}\right) \cdot yi\right) + \left(\left(\left(1 - ux\right) \cdot maxCos\right) \cdot ux\right) \cdot zi
\begin{array}{l}
t_0 := \left(uy \cdot 2\right) \cdot \pi\\
t_1 := \left(1 - ux\right) \cdot maxCos\\
\mathsf{fma}\left(ux, t_1 \cdot zi, \sqrt{\mathsf{fma}\left(ux, ux \cdot \left(t_1 \cdot \left(ux \cdot maxCos - maxCos\right)\right), 1\right)} \cdot \mathsf{fma}\left(\cos \left(\mathsf{expm1}\left(\mathsf{log1p}\left(t_0\right)\right)\right), xi, \sin t_0 \cdot yi\right)\right)
\end{array}
(FPCore (xi yi zi ux uy maxCos)
 :precision binary32
 (+
  (+
   (*
    (*
     (cos (* (* uy 2.0) PI))
     (sqrt
      (- 1.0 (* (* (* (- 1.0 ux) maxCos) ux) (* (* (- 1.0 ux) maxCos) ux)))))
    xi)
   (*
    (*
     (sin (* (* uy 2.0) PI))
     (sqrt
      (- 1.0 (* (* (* (- 1.0 ux) maxCos) ux) (* (* (- 1.0 ux) maxCos) ux)))))
    yi))
  (* (* (* (- 1.0 ux) maxCos) ux) zi)))
(FPCore (xi yi zi ux uy maxCos)
 :precision binary32
 (let* ((t_0 (* (* uy 2.0) PI)) (t_1 (* (- 1.0 ux) maxCos)))
   (fma
    ux
    (* t_1 zi)
    (*
     (sqrt (fma ux (* ux (* t_1 (- (* ux maxCos) maxCos))) 1.0))
     (fma (cos (expm1 (log1p t_0))) xi (* (sin t_0) yi))))))
float code(float xi, float yi, float zi, float ux, float uy, float maxCos) {
	return (((cosf((uy * 2.0f) * ((float) M_PI)) * sqrtf(1.0f - ((((1.0f - ux) * maxCos) * ux) * (((1.0f - ux) * maxCos) * ux)))) * xi) + ((sinf((uy * 2.0f) * ((float) M_PI)) * sqrtf(1.0f - ((((1.0f - ux) * maxCos) * ux) * (((1.0f - ux) * maxCos) * ux)))) * yi)) + ((((1.0f - ux) * maxCos) * ux) * zi);
}
float code(float xi, float yi, float zi, float ux, float uy, float maxCos) {
	float t_0 = (uy * 2.0f) * ((float) M_PI);
	float t_1 = (1.0f - ux) * maxCos;
	return fmaf(ux, (t_1 * zi), (sqrtf(fmaf(ux, (ux * (t_1 * ((ux * maxCos) - maxCos))), 1.0f)) * fmaf(cosf(expm1f(log1pf(t_0))), xi, (sinf(t_0) * yi))));
}

Error

Bits error versus xi

Bits error versus yi

Bits error versus zi

Bits error versus ux

Bits error versus uy

Bits error versus maxCos

Derivation

  1. Initial program 0.3

    \[\left(\left(\cos \left(\left(uy \cdot 2\right) \cdot \pi\right) \cdot \sqrt{1 - \left(\left(\left(1 - ux\right) \cdot maxCos\right) \cdot ux\right) \cdot \left(\left(\left(1 - ux\right) \cdot maxCos\right) \cdot ux\right)}\right) \cdot xi + \left(\sin \left(\left(uy \cdot 2\right) \cdot \pi\right) \cdot \sqrt{1 - \left(\left(\left(1 - ux\right) \cdot maxCos\right) \cdot ux\right) \cdot \left(\left(\left(1 - ux\right) \cdot maxCos\right) \cdot ux\right)}\right) \cdot yi\right) + \left(\left(\left(1 - ux\right) \cdot maxCos\right) \cdot ux\right) \cdot zi \]
  2. Simplified0.3

    \[\leadsto \color{blue}{\mathsf{fma}\left(ux, \left(\left(1 - ux\right) \cdot maxCos\right) \cdot zi, \sqrt{\mathsf{fma}\left(ux, ux \cdot \left(\left(\left(1 - ux\right) \cdot maxCos\right) \cdot \left(ux \cdot maxCos - maxCos\right)\right), 1\right)} \cdot \mathsf{fma}\left(\cos \left(\left(uy \cdot 2\right) \cdot \pi\right), xi, \sin \left(\left(uy \cdot 2\right) \cdot \pi\right) \cdot yi\right)\right)} \]
  3. Applied expm1-log1p-u_binary320.3

    \[\leadsto \mathsf{fma}\left(ux, \left(\left(1 - ux\right) \cdot maxCos\right) \cdot zi, \sqrt{\mathsf{fma}\left(ux, ux \cdot \left(\left(\left(1 - ux\right) \cdot maxCos\right) \cdot \left(ux \cdot maxCos - maxCos\right)\right), 1\right)} \cdot \mathsf{fma}\left(\cos \color{blue}{\left(\mathsf{expm1}\left(\mathsf{log1p}\left(\left(uy \cdot 2\right) \cdot \pi\right)\right)\right)}, xi, \sin \left(\left(uy \cdot 2\right) \cdot \pi\right) \cdot yi\right)\right) \]
  4. Final simplification0.3

    \[\leadsto \mathsf{fma}\left(ux, \left(\left(1 - ux\right) \cdot maxCos\right) \cdot zi, \sqrt{\mathsf{fma}\left(ux, ux \cdot \left(\left(\left(1 - ux\right) \cdot maxCos\right) \cdot \left(ux \cdot maxCos - maxCos\right)\right), 1\right)} \cdot \mathsf{fma}\left(\cos \left(\mathsf{expm1}\left(\mathsf{log1p}\left(\left(uy \cdot 2\right) \cdot \pi\right)\right)\right), xi, \sin \left(\left(uy \cdot 2\right) \cdot \pi\right) \cdot yi\right)\right) \]

Reproduce

herbie shell --seed 2022068 
(FPCore (xi yi zi ux uy maxCos)
  :name "UniformSampleCone 2"
  :precision binary32
  :pre (and (and (and (and (and (and (<= -10000.0 xi) (<= xi 10000.0)) (and (<= -10000.0 yi) (<= yi 10000.0))) (and (<= -10000.0 zi) (<= zi 10000.0))) (and (<= 2.328306437e-10 ux) (<= ux 1.0))) (and (<= 2.328306437e-10 uy) (<= uy 1.0))) (and (<= 0.0 maxCos) (<= maxCos 1.0)))
  (+ (+ (* (* (cos (* (* uy 2.0) PI)) (sqrt (- 1.0 (* (* (* (- 1.0 ux) maxCos) ux) (* (* (- 1.0 ux) maxCos) ux))))) xi) (* (* (sin (* (* uy 2.0) PI)) (sqrt (- 1.0 (* (* (* (- 1.0 ux) maxCos) ux) (* (* (- 1.0 ux) maxCos) ux))))) yi)) (* (* (* (- 1.0 ux) maxCos) ux) zi)))