Result for math.abs on complex (squared)

Specification

\[\begin{array}{l} \\ re \cdot re + im \cdot im \end{array} \]

(FPCore modulus_sqr (re im) :precision binary64 (+ (* re re) (* im im)))

double modulus_sqr(double re, double im) {
	return (re * re) + (im * im);
}

real(8) function modulus_sqr(re, im)
    real(8), intent (in) :: re
    real(8), intent (in) :: im
    modulus_sqr = (re * re) + (im * im)
end function

public static double modulus_sqr(double re, double im) {
	return (re * re) + (im * im);
}

def modulus_sqr(re, im):
	return (re * re) + (im * im)

function modulus_sqr(re, im)
	return Float64(Float64(re * re) + Float64(im * im))
end

function tmp = modulus_sqr(re, im)
	tmp = (re * re) + (im * im);
end

modulus$95$sqr[re_, im_] := N[(N[(re * re), $MachinePrecision] + N[(im * im), $MachinePrecision]), $MachinePrecision]

\begin{array}{l}

\\
re \cdot re + im \cdot im
\end{array}

Sampling outcomes in binary64 precision:

Initial Program: 100.0% accurate, 1.0× speedup?

\[\begin{array}{l} \\ re \cdot re + im \cdot im \end{array} \]

(FPCore modulus_sqr (re im) :precision binary64 (+ (* re re) (* im im)))

double modulus_sqr(double re, double im) {
	return (re * re) + (im * im);
}

real(8) function modulus_sqr(re, im)
    real(8), intent (in) :: re
    real(8), intent (in) :: im
    modulus_sqr = (re * re) + (im * im)
end function

public static double modulus_sqr(double re, double im) {
	return (re * re) + (im * im);
}

def modulus_sqr(re, im):
	return (re * re) + (im * im)

function modulus_sqr(re, im)
	return Float64(Float64(re * re) + Float64(im * im))
end

function tmp = modulus_sqr(re, im)
	tmp = (re * re) + (im * im);
end

modulus$95$sqr[re_, im_] := N[(N[(re * re), $MachinePrecision] + N[(im * im), $MachinePrecision]), $MachinePrecision]

\begin{array}{l}

\\
re \cdot re + im \cdot im
\end{array}

Alternative 1: 100.0% accurate, 0.1× speedup?

\[\begin{array}{l} re_m = \left|re\right| \\ [re_m, im] = \mathsf{sort}([re_m, im])\\ \\ \mathsf{fma}\left(im, im, re\_m \cdot re\_m\right) \end{array} \]

re_m = (fabs.f64 re)
NOTE: re_m and im should be sorted in increasing order before calling this function.
(FPCore modulus_sqr (re_m im) :precision binary64 (fma im im (* re_m re_m)))

re_m = fabs(re);
assert(re_m < im);
double modulus_sqr(double re_m, double im) {
	return fma(im, im, (re_m * re_m));
}

re_m = abs(re)
re_m, im = sort([re_m, im])
function modulus_sqr(re_m, im)
	return fma(im, im, Float64(re_m * re_m))
end

re_m = N[Abs[re], $MachinePrecision]
NOTE: re_m and im should be sorted in increasing order before calling this function.
modulus$95$sqr[re$95$m_, im_] := N[(im * im + N[(re$95$m * re$95$m), $MachinePrecision]), $MachinePrecision]

\begin{array}{l}
re_m = \left|re\right|
\\
[re_m, im] = \mathsf{sort}([re_m, im])\\
\\
\mathsf{fma}\left(im, im, re\_m \cdot re\_m\right)
\end{array}

Derivation

Initial program 100.0%
\[re \cdot re + im \cdot im \]
Add Preprocessing
Step-by-step derivation
1. +-commutative100.0%
  \[\leadsto \color{blue}{im \cdot im + re \cdot re} \]
2. fma-define100.0%
  \[\leadsto \color{blue}{\mathsf{fma}\left(im, im, re \cdot re\right)} \]
3. pow2100.0%
  \[\leadsto \mathsf{fma}\left(im, im, \color{blue}{{re}^{2}}\right) \]
Applied egg-rr100.0%
\[\leadsto \color{blue}{\mathsf{fma}\left(im, im, {re}^{2}\right)} \]
Step-by-step derivation
1. unpow2100.0%
  \[\leadsto \mathsf{fma}\left(im, im, \color{blue}{re \cdot re}\right) \]
Applied egg-rr100.0%
\[\leadsto \mathsf{fma}\left(im, im, \color{blue}{re \cdot re}\right) \]
Add Preprocessing

Alternative 2: 100.0% accurate, 1.0× speedup?

\[\begin{array}{l} re_m = \left|re\right| \\ [re_m, im] = \mathsf{sort}([re_m, im])\\ \\ re\_m \cdot re\_m + im \cdot im \end{array} \]

re_m = (fabs.f64 re)
NOTE: re_m and im should be sorted in increasing order before calling this function.
(FPCore modulus_sqr (re_m im) :precision binary64 (+ (* re_m re_m) (* im im)))

re_m = fabs(re);
assert(re_m < im);
double modulus_sqr(double re_m, double im) {
	return (re_m * re_m) + (im * im);
}

re_m = abs(re)
NOTE: re_m and im should be sorted in increasing order before calling this function.
real(8) function modulus_sqr(re_m, im)
    real(8), intent (in) :: re_m
    real(8), intent (in) :: im
    modulus_sqr = (re_m * re_m) + (im * im)
end function

re_m = Math.abs(re);
assert re_m < im;
public static double modulus_sqr(double re_m, double im) {
	return (re_m * re_m) + (im * im);
}

re_m = math.fabs(re)
[re_m, im] = sort([re_m, im])
def modulus_sqr(re_m, im):
	return (re_m * re_m) + (im * im)

re_m = abs(re)
re_m, im = sort([re_m, im])
function modulus_sqr(re_m, im)
	return Float64(Float64(re_m * re_m) + Float64(im * im))
end

re_m = abs(re);
re_m, im = num2cell(sort([re_m, im])){:}
function tmp = modulus_sqr(re_m, im)
	tmp = (re_m * re_m) + (im * im);
end

re_m = N[Abs[re], $MachinePrecision]
NOTE: re_m and im should be sorted in increasing order before calling this function.
modulus$95$sqr[re$95$m_, im_] := N[(N[(re$95$m * re$95$m), $MachinePrecision] + N[(im * im), $MachinePrecision]), $MachinePrecision]

\begin{array}{l}
re_m = \left|re\right|
\\
[re_m, im] = \mathsf{sort}([re_m, im])\\
\\
re\_m \cdot re\_m + im \cdot im
\end{array}

Derivation

Initial program 100.0%
\[re \cdot re + im \cdot im \]
Add Preprocessing
Add Preprocessing

math.abs on complex (squared)

44.0% of points produce a very large (infinite) output. You may want to add a precondition. (more)

Specification

Local Percentage Accuracy vs ?

Accuracy vs Speed?

Initial Program: 100.0% accurate, 1.0× speedup?

Alternative 1: 100.0% accurate, 0.1× speedup?

Alternative 2: 100.0% accurate, 1.0× speedup?

Reproduce

44.0% of points produce a very large (infinite) output. You may want to add a precondition. (more)

Specification

Local Percentage Accuracy vs ?

Accuracy vs Speed?

Initial Program: 100.0% accurate, 1.0× speedupMathFPCoreCFortranJavaPythonJuliaMATLABWolframTeX?

Alternative 1: 100.0% accurate, 0.1× speedupMathFPCoreCJuliaWolframTeX?

Alternative 2: 100.0% accurate, 1.0× speedupMathFPCoreCFortranJavaPythonJuliaMATLABWolframTeX?

Reproduce

Initial Program: 100.0% accurate, 1.0× speedup?

Alternative 1: 100.0% accurate, 0.1× speedup?

Alternative 2: 100.0% accurate, 1.0× speedup?