Result for Disney BSSRDF, sample scattering profile, upper

Specification

\[\left(0 \leq s \land s \leq 256\right) \land \left(0.25 \leq u \land u \leq 1\right)\]

\[\left(3 \cdot s\right) \cdot \log \left(\frac{1}{1 - \frac{u - 0.25}{0.75}}\right) \]

(FPCore (s u)
  :precision binary32
  :pre (and (and (<= 0.0 s) (<= s 256.0)) (and (<= 0.25 u) (<= u 1.0)))
  (* (* 3.0 s) (log (/ 1.0 (- 1.0 (/ (- u 0.25) 0.75))))))

float code(float s, float u) {
	return (3.0f * s) * logf((1.0f / (1.0f - ((u - 0.25f) / 0.75f))));
}

real(4) function code(s, u)
use fmin_fmax_functions
    real(4), intent (in) :: s
    real(4), intent (in) :: u
    code = (3.0e0 * s) * log((1.0e0 / (1.0e0 - ((u - 0.25e0) / 0.75e0))))
end function

function code(s, u)
	return Float32(Float32(Float32(3.0) * s) * log(Float32(Float32(1.0) / Float32(Float32(1.0) - Float32(Float32(u - Float32(0.25)) / Float32(0.75))))))
end

function tmp = code(s, u)
	tmp = (single(3.0) * s) * log((single(1.0) / (single(1.0) - ((u - single(0.25)) / single(0.75)))));
end

\left(3 \cdot s\right) \cdot \log \left(\frac{1}{1 - \frac{u - 0.25}{0.75}}\right)

Initial Program: 95.8% accurate, 1.0× speedup?

\[\left(0 \leq s \land s \leq 256\right) \land \left(0.25 \leq u \land u \leq 1\right)\]

\[\left(3 \cdot s\right) \cdot \log \left(\frac{1}{1 - \frac{u - 0.25}{0.75}}\right) \]

(FPCore (s u)
  :precision binary32
  :pre (and (and (<= 0.0 s) (<= s 256.0)) (and (<= 0.25 u) (<= u 1.0)))
  (* (* 3.0 s) (log (/ 1.0 (- 1.0 (/ (- u 0.25) 0.75))))))

float code(float s, float u) {
	return (3.0f * s) * logf((1.0f / (1.0f - ((u - 0.25f) / 0.75f))));
}

real(4) function code(s, u)
use fmin_fmax_functions
    real(4), intent (in) :: s
    real(4), intent (in) :: u
    code = (3.0e0 * s) * log((1.0e0 / (1.0e0 - ((u - 0.25e0) / 0.75e0))))
end function

function code(s, u)
	return Float32(Float32(Float32(3.0) * s) * log(Float32(Float32(1.0) / Float32(Float32(1.0) - Float32(Float32(u - Float32(0.25)) / Float32(0.75))))))
end

function tmp = code(s, u)
	tmp = (single(3.0) * s) * log((single(1.0) / (single(1.0) - ((u - single(0.25)) / single(0.75)))));
end

\left(3 \cdot s\right) \cdot \log \left(\frac{1}{1 - \frac{u - 0.25}{0.75}}\right)

Alternative 1: 97.9% accurate, 1.2× speedup?

\[\left(0 \leq s \land s \leq 256\right) \land \left(0.25 \leq u \land u \leq 1\right)\]

\[s \cdot \left(-3 \cdot \mathsf{log1p}\left(\mathsf{fma}\left(u, -1.3333333333333333, 0.3333333333333333\right)\right)\right) \]

(FPCore (s u)
  :precision binary32
  :pre (and (and (<= 0.0 s) (<= s 256.0)) (and (<= 0.25 u) (<= u 1.0)))
  (* s (* -3.0 (log1p (fma u -1.3333333333333333 0.3333333333333333)))))

float code(float s, float u) {
	return s * (-3.0f * log1pf(fmaf(u, -1.3333333333333333f, 0.3333333333333333f)));
}

function code(s, u)
	return Float32(s * Float32(Float32(-3.0) * log1p(fma(u, Float32(-1.3333333333333333), Float32(0.3333333333333333)))))
end

s \cdot \left(-3 \cdot \mathsf{log1p}\left(\mathsf{fma}\left(u, -1.3333333333333333, 0.3333333333333333\right)\right)\right)

Derivation

Initial program 95.8%
\[\left(3 \cdot s\right) \cdot \log \left(\frac{1}{1 - \frac{u - 0.25}{0.75}}\right) \]
Applied rewrites96.2%
\[\leadsto s \cdot \left(-3 \cdot \log \left(\left(u - 1\right) \cdot -1.3333333333333333\right)\right) \]
Applied rewrites95.4%
\[\leadsto s \cdot \left(-3 \cdot \left(\log 1.3333333333333333 + \log \left(\left|1 - u\right|\right)\right)\right) \]
Applied rewrites95.6%
\[\leadsto s \cdot \left(-3 \cdot \left(\log 1.3333333333333333 + \log \left(\left|1 - 2.6666666666666665 \cdot \left(0.375 \cdot u\right)\right|\right)\right)\right) \]
Applied rewrites97.9%
\[\leadsto s \cdot \left(-3 \cdot \mathsf{log1p}\left(\mathsf{fma}\left(u, -1.3333333333333333, 0.3333333333333333\right)\right)\right) \]
Add Preprocessing

Alternative 2: 96.7% accurate, 1.4× speedup?

\[\left(0 \leq s \land s \leq 256\right) \land \left(0.25 \leq u \land u \leq 1\right)\]

\[-3 \cdot \left(\log \left(\mathsf{fma}\left(u, -1.3333333333333333, 1.3333333333333333\right)\right) \cdot s\right) \]

(FPCore (s u)
  :precision binary32
  :pre (and (and (<= 0.0 s) (<= s 256.0)) (and (<= 0.25 u) (<= u 1.0)))
  (* -3.0 (* (log (fma u -1.3333333333333333 1.3333333333333333)) s)))

float code(float s, float u) {
	return -3.0f * (logf(fmaf(u, -1.3333333333333333f, 1.3333333333333333f)) * s);
}

function code(s, u)
	return Float32(Float32(-3.0) * Float32(log(fma(u, Float32(-1.3333333333333333), Float32(1.3333333333333333))) * s))
end

-3 \cdot \left(\log \left(\mathsf{fma}\left(u, -1.3333333333333333, 1.3333333333333333\right)\right) \cdot s\right)

Derivation

Initial program 95.8%
\[\left(3 \cdot s\right) \cdot \log \left(\frac{1}{1 - \frac{u - 0.25}{0.75}}\right) \]
Applied rewrites96.2%
\[\leadsto s \cdot \left(-3 \cdot \log \left(\left(u - 1\right) \cdot -1.3333333333333333\right)\right) \]
Applied rewrites96.7%
\[\leadsto -3 \cdot \left(\log \left(\mathsf{fma}\left(u, -1.3333333333333333, 1.3333333333333333\right)\right) \cdot s\right) \]
Add Preprocessing

Alternative 3: 36.6% accurate, 1.4× speedup?

\[\left(0 \leq s \land s \leq 256\right) \land \left(0.25 \leq u \land u \leq 1\right)\]

\[s \cdot \left(u \cdot \left(3 + u \cdot \left(1.5 + u\right)\right) - 0.8630462288856506\right) \]

(FPCore (s u)
  :precision binary32
  :pre (and (and (<= 0.0 s) (<= s 256.0)) (and (<= 0.25 u) (<= u 1.0)))
  (* s (- (* u (+ 3.0 (* u (+ 1.5 u)))) 0.8630462288856506)))

float code(float s, float u) {
	return s * ((u * (3.0f + (u * (1.5f + u)))) - 0.8630462288856506f);
}

real(4) function code(s, u)
use fmin_fmax_functions
    real(4), intent (in) :: s
    real(4), intent (in) :: u
    code = s * ((u * (3.0e0 + (u * (1.5e0 + u)))) - 0.8630462288856506e0)
end function

function code(s, u)
	return Float32(s * Float32(Float32(u * Float32(Float32(3.0) + Float32(u * Float32(Float32(1.5) + u)))) - Float32(0.8630462288856506)))
end

function tmp = code(s, u)
	tmp = s * ((u * (single(3.0) + (u * (single(1.5) + u)))) - single(0.8630462288856506));
end

s \cdot \left(u \cdot \left(3 + u \cdot \left(1.5 + u\right)\right) - 0.8630462288856506\right)

Derivation

Initial program 95.8%
\[\left(3 \cdot s\right) \cdot \log \left(\frac{1}{1 - \frac{u - 0.25}{0.75}}\right) \]
Applied rewrites96.2%
\[\leadsto s \cdot \left(-3 \cdot \log \left(\left(u - 1\right) \cdot -1.3333333333333333\right)\right) \]
Applied rewrites95.5%
\[\leadsto s \cdot \mathsf{fma}\left(-3, \log \left(\left|1 - u\right|\right), -3 \cdot \log 1.3333333333333333\right) \]
Evaluated real constant96.7%
\[\leadsto s \cdot \mathsf{fma}\left(-3, \log \left(\left|1 - u\right|\right), -0.8630462288856506\right) \]
Taylor expanded in u around 0
\[\leadsto s \cdot \left(u \cdot \left(3 + u \cdot \left(\frac{3}{2} + u\right)\right) - \frac{14479513}{16777216}\right) \]
Applied rewrites36.6%
\[\leadsto s \cdot \left(u \cdot \left(3 + u \cdot \left(1.5 + u\right)\right) - 0.8630462288856506\right) \]
Add Preprocessing

Alternative 4: 32.0% accurate, 1.7× speedup?

\[\left(0 \leq s \land s \leq 256\right) \land \left(0.25 \leq u \land u \leq 1\right)\]

\[s \cdot \left(u \cdot \left(3 + 1.5 \cdot u\right) - 0.8630462288856506\right) \]

(FPCore (s u)
  :precision binary32
  :pre (and (and (<= 0.0 s) (<= s 256.0)) (and (<= 0.25 u) (<= u 1.0)))
  (* s (- (* u (+ 3.0 (* 1.5 u))) 0.8630462288856506)))

float code(float s, float u) {
	return s * ((u * (3.0f + (1.5f * u))) - 0.8630462288856506f);
}

real(4) function code(s, u)
use fmin_fmax_functions
    real(4), intent (in) :: s
    real(4), intent (in) :: u
    code = s * ((u * (3.0e0 + (1.5e0 * u))) - 0.8630462288856506e0)
end function

function code(s, u)
	return Float32(s * Float32(Float32(u * Float32(Float32(3.0) + Float32(Float32(1.5) * u))) - Float32(0.8630462288856506)))
end

function tmp = code(s, u)
	tmp = s * ((u * (single(3.0) + (single(1.5) * u))) - single(0.8630462288856506));
end

s \cdot \left(u \cdot \left(3 + 1.5 \cdot u\right) - 0.8630462288856506\right)

Derivation

Initial program 95.8%
\[\left(3 \cdot s\right) \cdot \log \left(\frac{1}{1 - \frac{u - 0.25}{0.75}}\right) \]
Applied rewrites96.2%
\[\leadsto s \cdot \left(-3 \cdot \log \left(\left(u - 1\right) \cdot -1.3333333333333333\right)\right) \]
Applied rewrites95.5%
\[\leadsto s \cdot \mathsf{fma}\left(-3, \log \left(\left|1 - u\right|\right), -3 \cdot \log 1.3333333333333333\right) \]
Evaluated real constant96.7%
\[\leadsto s \cdot \mathsf{fma}\left(-3, \log \left(\left|1 - u\right|\right), -0.8630462288856506\right) \]
Taylor expanded in u around 0
\[\leadsto s \cdot \left(u \cdot \left(3 + \frac{3}{2} \cdot u\right) - \frac{14479513}{16777216}\right) \]
Applied rewrites32.0%
\[\leadsto s \cdot \left(u \cdot \left(3 + 1.5 \cdot u\right) - 0.8630462288856506\right) \]
Add Preprocessing

Alternative 5: 25.6% accurate, 2.7× speedup?

\[\left(0 \leq s \land s \leq 256\right) \land \left(0.25 \leq u \land u \leq 1\right)\]

\[s \cdot \left(3 \cdot u - 0.8630462288856506\right) \]

(FPCore (s u)
  :precision binary32
  :pre (and (and (<= 0.0 s) (<= s 256.0)) (and (<= 0.25 u) (<= u 1.0)))
  (* s (- (* 3.0 u) 0.8630462288856506)))

float code(float s, float u) {
	return s * ((3.0f * u) - 0.8630462288856506f);
}

real(4) function code(s, u)
use fmin_fmax_functions
    real(4), intent (in) :: s
    real(4), intent (in) :: u
    code = s * ((3.0e0 * u) - 0.8630462288856506e0)
end function

function code(s, u)
	return Float32(s * Float32(Float32(Float32(3.0) * u) - Float32(0.8630462288856506)))
end

function tmp = code(s, u)
	tmp = s * ((single(3.0) * u) - single(0.8630462288856506));
end

s \cdot \left(3 \cdot u - 0.8630462288856506\right)

Derivation

Initial program 95.8%
\[\left(3 \cdot s\right) \cdot \log \left(\frac{1}{1 - \frac{u - 0.25}{0.75}}\right) \]
Applied rewrites96.2%
\[\leadsto s \cdot \left(-3 \cdot \log \left(\left(u - 1\right) \cdot -1.3333333333333333\right)\right) \]
Applied rewrites95.5%
\[\leadsto s \cdot \mathsf{fma}\left(-3, \log \left(\left|1 - u\right|\right), -3 \cdot \log 1.3333333333333333\right) \]
Evaluated real constant96.7%
\[\leadsto s \cdot \mathsf{fma}\left(-3, \log \left(\left|1 - u\right|\right), -0.8630462288856506\right) \]
Taylor expanded in u around 0
\[\leadsto s \cdot \left(3 \cdot u - \frac{14479513}{16777216}\right) \]
Applied rewrites25.6%
\[\leadsto s \cdot \left(3 \cdot u - 0.8630462288856506\right) \]
Add Preprocessing

Alternative 6: 25.6% accurate, 2.7× speedup?

\[\left(0 \leq s \land s \leq 256\right) \land \left(0.25 \leq u \land u \leq 1\right)\]

\[3 \cdot \left(s \cdot \left(u + -0.28768208622932434\right)\right) \]

(FPCore (s u)
  :precision binary32
  :pre (and (and (<= 0.0 s) (<= s 256.0)) (and (<= 0.25 u) (<= u 1.0)))
  (* 3.0 (* s (+ u -0.28768208622932434))))

float code(float s, float u) {
	return 3.0f * (s * (u + -0.28768208622932434f));
}

real(4) function code(s, u)
use fmin_fmax_functions
    real(4), intent (in) :: s
    real(4), intent (in) :: u
    code = 3.0e0 * (s * (u + (-0.28768208622932434e0)))
end function

function code(s, u)
	return Float32(Float32(3.0) * Float32(s * Float32(u + Float32(-0.28768208622932434))))
end

function tmp = code(s, u)
	tmp = single(3.0) * (s * (u + single(-0.28768208622932434)));
end

3 \cdot \left(s \cdot \left(u + -0.28768208622932434\right)\right)

Derivation

Initial program 95.8%
\[\left(3 \cdot s\right) \cdot \log \left(\frac{1}{1 - \frac{u - 0.25}{0.75}}\right) \]
Taylor expanded in s around 0
\[\leadsto 3 \cdot \left(s \cdot \log \left(\frac{1}{1 - \frac{4}{3} \cdot \left(u - \frac{1}{4}\right)}\right)\right) \]
Applied rewrites95.6%
\[\leadsto 3 \cdot \left(s \cdot \log \left(\frac{1}{1 - 1.3333333333333333 \cdot \left(u - 0.25\right)}\right)\right) \]
Taylor expanded in u around 0
\[\leadsto 3 \cdot \left(s \cdot \left(u + \log \frac{3}{4}\right)\right) \]
Applied rewrites25.6%
\[\leadsto 3 \cdot \left(s \cdot \left(u + \log 0.75\right)\right) \]
Evaluated real constant25.6%
\[\leadsto 3 \cdot \left(s \cdot \left(u + -0.28768208622932434\right)\right) \]
Add Preprocessing

Alternative 7: 10.6% accurate, 3.7× speedup?

\[\left(0 \leq s \land s \leq 256\right) \land \left(0.25 \leq u \land u \leq 1\right)\]

\[0 \cdot \left(s \cdot -0.28768208622932434\right) \]

(FPCore (s u)
  :precision binary32
  :pre (and (and (<= 0.0 s) (<= s 256.0)) (and (<= 0.25 u) (<= u 1.0)))
  (* 0.0 (* s -0.28768208622932434)))

float code(float s, float u) {
	return 0.0f * (s * -0.28768208622932434f);
}

real(4) function code(s, u)
use fmin_fmax_functions
    real(4), intent (in) :: s
    real(4), intent (in) :: u
    code = 0.0e0 * (s * (-0.28768208622932434e0))
end function

function code(s, u)
	return Float32(Float32(0.0) * Float32(s * Float32(-0.28768208622932434)))
end

function tmp = code(s, u)
	tmp = single(0.0) * (s * single(-0.28768208622932434));
end

0 \cdot \left(s \cdot -0.28768208622932434\right)

Derivation

Initial program 95.8%
\[\left(3 \cdot s\right) \cdot \log \left(\frac{1}{1 - \frac{u - 0.25}{0.75}}\right) \]
Taylor expanded in u around 0
\[\leadsto 3 \cdot \left(s \cdot \log \frac{3}{4}\right) \]
Applied rewrites7.5%
\[\leadsto 3 \cdot \left(s \cdot \log 0.75\right) \]
Evaluated real constant7.5%
\[\leadsto 3 \cdot \left(s \cdot -0.28768208622932434\right) \]
Taylor expanded in undef-var around zero
\[\leadsto 0 \cdot \left(s \cdot -0.28768208622932434\right) \]
Applied rewrites10.6%
\[\leadsto 0 \cdot \left(s \cdot -0.28768208622932434\right) \]
Add Preprocessing

Alternative 8: 7.5% accurate, 6.4× speedup?

\[\left(0 \leq s \land s \leq 256\right) \land \left(0.25 \leq u \land u \leq 1\right)\]

\[s \cdot -0.8630462288856506 \]

(FPCore (s u)
  :precision binary32
  :pre (and (and (<= 0.0 s) (<= s 256.0)) (and (<= 0.25 u) (<= u 1.0)))
  (* s -0.8630462288856506))

float code(float s, float u) {
	return s * -0.8630462288856506f;
}

real(4) function code(s, u)
use fmin_fmax_functions
    real(4), intent (in) :: s
    real(4), intent (in) :: u
    code = s * (-0.8630462288856506e0)
end function

function code(s, u)
	return Float32(s * Float32(-0.8630462288856506))
end

function tmp = code(s, u)
	tmp = s * single(-0.8630462288856506);
end

s \cdot -0.8630462288856506

Derivation

Initial program 95.8%
\[\left(3 \cdot s\right) \cdot \log \left(\frac{1}{1 - \frac{u - 0.25}{0.75}}\right) \]
Applied rewrites96.2%
\[\leadsto s \cdot \left(-3 \cdot \log \left(\left(u - 1\right) \cdot -1.3333333333333333\right)\right) \]
Applied rewrites95.5%
\[\leadsto s \cdot \mathsf{fma}\left(-3, \log \left(\left|1 - u\right|\right), -3 \cdot \log 1.3333333333333333\right) \]
Evaluated real constant96.7%
\[\leadsto s \cdot \mathsf{fma}\left(-3, \log \left(\left|1 - u\right|\right), -0.8630462288856506\right) \]
Taylor expanded in u around 0
\[\leadsto s \cdot \frac{-14479513}{16777216} \]
Applied rewrites7.5%
\[\leadsto s \cdot -0.8630462288856506 \]
Add Preprocessing

Alternative 9: 7.5% accurate, 6.4× speedup?

\[\left(0 \leq s \land s \leq 256\right) \land \left(0.25 \leq u \land u \leq 1\right)\]

\[-0.863046258687973 \cdot s \]

(FPCore (s u)
  :precision binary32
  :pre (and (and (<= 0.0 s) (<= s 256.0)) (and (<= 0.25 u) (<= u 1.0)))
  (* -0.863046258687973 s))

float code(float s, float u) {
	return -0.863046258687973f * s;
}

real(4) function code(s, u)
use fmin_fmax_functions
    real(4), intent (in) :: s
    real(4), intent (in) :: u
    code = (-0.863046258687973e0) * s
end function

function code(s, u)
	return Float32(Float32(-0.863046258687973) * s)
end

function tmp = code(s, u)
	tmp = single(-0.863046258687973) * s;
end

-0.863046258687973 \cdot s

Derivation

Initial program 95.8%
\[\left(3 \cdot s\right) \cdot \log \left(\frac{1}{1 - \frac{u - 0.25}{0.75}}\right) \]
Taylor expanded in u around 0
\[\leadsto 3 \cdot \left(s \cdot \log \frac{3}{4}\right) \]
Applied rewrites7.5%
\[\leadsto 3 \cdot \left(s \cdot \log 0.75\right) \]
Evaluated real constant7.5%
\[\leadsto 3 \cdot \left(s \cdot -0.28768208622932434\right) \]
Applied rewrites7.5%
\[\leadsto -0.863046258687973 \cdot s \]
Add Preprocessing

Disney BSSRDF, sample scattering profile, upper

Specification

Local Percentage Accuracy vs ?

Accuracy vs Speed?

Initial Program: 95.8% accurate, 1.0× speedup?

Alternative 1: 97.9% accurate, 1.2× speedup?

Alternative 2: 96.7% accurate, 1.4× speedup?

Alternative 3: 36.6% accurate, 1.4× speedup?

Alternative 4: 32.0% accurate, 1.7× speedup?

Alternative 5: 25.6% accurate, 2.7× speedup?

Alternative 6: 25.6% accurate, 2.7× speedup?

Alternative 7: 10.6% accurate, 3.7× speedup?

Alternative 8: 7.5% accurate, 6.4× speedup?

Alternative 9: 7.5% accurate, 6.4× speedup?

Reproduce

Specification

Local Percentage Accuracy vs ?

Accuracy vs Speed?

Initial Program: 95.8% accurate, 1.0× speedupMathFPCoreCFortranJuliaMATLABTeX?

Alternative 1: 97.9% accurate, 1.2× speedupMathFPCoreCJuliaTeX?

Alternative 2: 96.7% accurate, 1.4× speedupMathFPCoreCJuliaTeX?

Alternative 3: 36.6% accurate, 1.4× speedupMathFPCoreCFortranJuliaMATLABTeX?

Alternative 4: 32.0% accurate, 1.7× speedupMathFPCoreCFortranJuliaMATLABTeX?

Alternative 5: 25.6% accurate, 2.7× speedupMathFPCoreCFortranJuliaMATLABTeX?

Alternative 6: 25.6% accurate, 2.7× speedupMathFPCoreCFortranJuliaMATLABTeX?

Alternative 7: 10.6% accurate, 3.7× speedupMathFPCoreCFortranJuliaMATLABTeX?

Alternative 8: 7.5% accurate, 6.4× speedupMathFPCoreCFortranJuliaMATLABTeX?

Alternative 9: 7.5% accurate, 6.4× speedupMathFPCoreCFortranJuliaMATLABTeX?

Reproduce

Initial Program: 95.8% accurate, 1.0× speedup?

Alternative 1: 97.9% accurate, 1.2× speedup?

Alternative 2: 96.7% accurate, 1.4× speedup?

Alternative 3: 36.6% accurate, 1.4× speedup?

Alternative 4: 32.0% accurate, 1.7× speedup?

Alternative 5: 25.6% accurate, 2.7× speedup?

Alternative 6: 25.6% accurate, 2.7× speedup?

Alternative 7: 10.6% accurate, 3.7× speedup?

Alternative 8: 7.5% accurate, 6.4× speedup?

Alternative 9: 7.5% accurate, 6.4× speedup?