floating-point

Fließkommazahlen sind Näherungen reeller Zahlen, die größere Bereiche als Ganzzahlen darstellen können, aber die gleiche Menge an Speicher verwenden, auf Kosten geringerer Genauigkeit. Wenn es sich bei Ihrer Frage um kleine arithmetische Fehler (z. B. warum 0,2 + 0,1 ist gleich 0,300000001?) Oder um Dezimalwandlungsfehler handelt, lesen Sie bitte die unten verlinkte Seite "info" vor dem Posten.
2
Antworten

Verwerfen Casting und Assignment wirklich jede Extra-Präzision von Floats?

Ich lese die neue C ++ FAQ und sehe das auch, wenn x == y Für double x, y; ist das möglich für: %Vor% wird in false ausgewertet. Dies liegt daran, dass die Maschine einen Prozessor haben kann, der erweiterte Genauigkeit unterstütz...
05.05.2016, 20:23
1
Antwort

Optimiere für schnelle Multiplikation, aber langsame Addition: FMA und doubleouble

Als ich einen Haswell-Prozessor bekam, habe ich versucht, FMA zu implementieren, um das Mandelbrot-Set zu bestimmen. Der Hauptalgorithmus ist dies: %Vor% Dies bestimmt, ob n Pixel im Mandelbrot-Set sind. Also für Doppel-Gleitpunkt läuft e...
01.06.2015, 12:25
1
Antwort

Schnellster Algorithmus zur Identifizierung des kleinsten und größten x, der die Doppelpräzisionsgleichung x + a == b wahr ergibt

Im Zusammenhang mit der statischen Analyse bin ich daran interessiert, die Werte von x im then-Zweig der folgenden Bedingung zu bestimmen: %Vor% a und b können als Konstanten mit doppelter Genauigkeit angenommen werden (die Verallge...
14.06.2014, 18:12
1
Antwort

Seltsames Verhalten des Programms in GNU C ++ unter Verwendung von Gleitkommazahlen

Schau dir dieses Programm an: %Vor% Funktion dist gibt die Entfernung zwischen zwei Punkten zurück. A, B, C, D sind Ecken des Quadrats. Es sollte dist (A, B) == dist (B, C) == dist (C, D) == dist (D, A) == sqrt (2) sein. Und dist (A, B...
12.11.2014, 11:06
1
Antwort

C ++ / CLI: SIGFPE, _control87, _fpreset, Portierung der alten nicht verwalteten Watcom C-Anwendung auf .NET

Ich habe eine mehrere tausend Zeilen umfassende Anwendung, die auf SIGFPE angewiesen ist (behandelt durch einen Funktionszeiger, der an signal () übergeben wird), um den Zustand zu ändern und den Code korrekt laufen zu lassen, wenn bestimmte Gle...
26.07.2010, 20:01
4
Antworten

Welche Sprachen stellen IEEE 754-Traps dem Entwickler zur Verfügung?

Ich würde gerne mit diesen Fallen für Bildungszwecke spielen. Ein häufiges Problem mit dem Standardverhalten im numerischen Kalkül ist, dass wir das Nan (oder + -inf), das in einer falschen Operation auftrat, "übersehen" haben. Standardverhal...
30.03.2009, 21:19
1
Antwort

Berücksichtigen gcc's __float128 Gleitkommazahlen den aktuellen Rundungsmodus?

Berücksichtigen die arithmetischen Operationen an Gcc __float128 Gleitkommazahlen den aktuellen Rundungsmodus? Wenn ich zum Beispiel die C ++ 11-Funktion std::fesetenv verwende, ändere ich den Rundungsmodus in FE_DOWNWARD , werden die...
23.09.2014, 06:39
1
Antwort

Über das Argument float_precision für pandas.read_csv

Die Dokumentation für das Argument im Titel dieses Beitrags lautet:    float_precision : Zeichenfolge, Standardwert: Keine       Gibt an, welchen Konverter die C-Engine für Gleitkommawerte verwenden soll. Die Optionen sind Keine für d...
22.06.2017, 11:12
1
Antwort

Erzwinge, dass alle QNaN normal NaN (SNaN) sind, sodass Ausnahmen ausgelöst werden

Ich habe Visual Studio so konfiguriert, dass Gleitkommaausnahmen über die _controlfp-Funktion ausgelöst werden. Dies funktioniert für NAN und INF, aber nicht für QNAN. I.e. Quiet NaNs verursachen keine Ausnahme. Gibt es eine Funktion oder eine K...
15.12.2010, 21:34
6
Antworten

Warum kann double größere Zahlen speichern als unsigned long long?

Die Frage ist, ich verstehe nicht recht, warum double größere Zahlen speichern kann als unsigned long long. Da beide 8 Bytes lang sind, also 64 Bits. Wenn in unsigned long long alle 64 Bits verwendet werden, um einen Wert zu speichern, hat do...
05.05.2015, 12:16