forge: main/sparse/SuperLU/SRC/zgsrfs.c annotate

annotate main/sparse/SuperLU/SRC/zgsrfs.c @ 0:6b33357c7561 octave-forge

Initial revision

author	pkienzle
date	Wed, 10 Oct 2001 19:54:49 +0000
parents
children	b4a6ffecde4b

rev	line source
0 6b33357c7561 Initial revision pkienzle parents: diff changeset	1
6b33357c7561 Initial revision pkienzle parents: diff changeset	2
6b33357c7561 Initial revision pkienzle parents: diff changeset	3 /*
6b33357c7561 Initial revision pkienzle parents: diff changeset	4 * -- SuperLU routine (version 2.0) --
6b33357c7561 Initial revision pkienzle parents: diff changeset	5 * Univ. of California Berkeley, Xerox Palo Alto Research Center,
6b33357c7561 Initial revision pkienzle parents: diff changeset	6 * and Lawrence Berkeley National Lab.
6b33357c7561 Initial revision pkienzle parents: diff changeset	7 * November 15, 1997
6b33357c7561 Initial revision pkienzle parents: diff changeset	8 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	9 */
6b33357c7561 Initial revision pkienzle parents: diff changeset	10 /*
6b33357c7561 Initial revision pkienzle parents: diff changeset	11 * File name: zgsrfs.c
6b33357c7561 Initial revision pkienzle parents: diff changeset	12 * History: Modified from lapack routine ZGERFS
6b33357c7561 Initial revision pkienzle parents: diff changeset	13 */
6b33357c7561 Initial revision pkienzle parents: diff changeset	14 #include <math.h>
6b33357c7561 Initial revision pkienzle parents: diff changeset	15 #include "zsp_defs.h"
6b33357c7561 Initial revision pkienzle parents: diff changeset	16 #include "util.h"
6b33357c7561 Initial revision pkienzle parents: diff changeset	17
6b33357c7561 Initial revision pkienzle parents: diff changeset	18 void
6b33357c7561 Initial revision pkienzle parents: diff changeset	19 zgsrfs(char trans, SuperMatrix A, SuperMatrix L, SuperMatrix U,
6b33357c7561 Initial revision pkienzle parents: diff changeset	20 int perm_r, int perm_c, char equed, double R, double *C,
6b33357c7561 Initial revision pkienzle parents: diff changeset	21 SuperMatrix B, SuperMatrix X,
6b33357c7561 Initial revision pkienzle parents: diff changeset	22 double ferr, double berr, int *info)
6b33357c7561 Initial revision pkienzle parents: diff changeset	23 {
6b33357c7561 Initial revision pkienzle parents: diff changeset	24 /*
6b33357c7561 Initial revision pkienzle parents: diff changeset	25 * Purpose
6b33357c7561 Initial revision pkienzle parents: diff changeset	26 * =======
6b33357c7561 Initial revision pkienzle parents: diff changeset	27 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	28 * ZGSRFS improves the computed solution to a system of linear
6b33357c7561 Initial revision pkienzle parents: diff changeset	29 * equations and provides error bounds and backward error estimates for
6b33357c7561 Initial revision pkienzle parents: diff changeset	30 * the solution.
6b33357c7561 Initial revision pkienzle parents: diff changeset	31 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	32 * If equilibration was performed, the system becomes:
6b33357c7561 Initial revision pkienzle parents: diff changeset	33 * (diag(R)A_originaldiag(C)) * X = diag(R)*B_original.
6b33357c7561 Initial revision pkienzle parents: diff changeset	34 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	35 * See supermatrix.h for the definition of 'SuperMatrix' structure.
6b33357c7561 Initial revision pkienzle parents: diff changeset	36 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	37 * Arguments
6b33357c7561 Initial revision pkienzle parents: diff changeset	38 * =========
6b33357c7561 Initial revision pkienzle parents: diff changeset	39 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	40 * trans (input) char*
6b33357c7561 Initial revision pkienzle parents: diff changeset	41 * Specifies the form of the system of equations:
6b33357c7561 Initial revision pkienzle parents: diff changeset	42 * = 'N': A * X = B (No transpose)
6b33357c7561 Initial revision pkienzle parents: diff changeset	43 * = 'T': A*T X = B (Transpose)
6b33357c7561 Initial revision pkienzle parents: diff changeset	44 * = 'C': A*H X = B (Conjugate transpose = Transpose)
6b33357c7561 Initial revision pkienzle parents: diff changeset	45 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	46 * A (input) SuperMatrix*
6b33357c7561 Initial revision pkienzle parents: diff changeset	47 * The original matrix A in the system, or the scaled A if
6b33357c7561 Initial revision pkienzle parents: diff changeset	48 * equilibration was done. The type of A can be:
6b33357c7561 Initial revision pkienzle parents: diff changeset	49 * Stype = NC, Dtype = _Z, Mtype = GE.
6b33357c7561 Initial revision pkienzle parents: diff changeset	50 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	51 * L (input) SuperMatrix*
6b33357c7561 Initial revision pkienzle parents: diff changeset	52 * The factor L from the factorization PrAPc=L*U. Use
6b33357c7561 Initial revision pkienzle parents: diff changeset	53 * compressed row subscripts storage for supernodes,
6b33357c7561 Initial revision pkienzle parents: diff changeset	54 * i.e., L has types: Stype = SC, Dtype = _Z, Mtype = TRLU.
6b33357c7561 Initial revision pkienzle parents: diff changeset	55 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	56 * U (input) SuperMatrix*
6b33357c7561 Initial revision pkienzle parents: diff changeset	57 * The factor U from the factorization PrAPc=L*U as computed by
6b33357c7561 Initial revision pkienzle parents: diff changeset	58 * zgstrf(). Use column-wise storage scheme,
6b33357c7561 Initial revision pkienzle parents: diff changeset	59 * i.e., U has types: Stype = NC, Dtype = _Z, Mtype = TRU.
6b33357c7561 Initial revision pkienzle parents: diff changeset	60 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	61 * perm_r (input) int*, dimension (A->nrow)
6b33357c7561 Initial revision pkienzle parents: diff changeset	62 * Row permutation vector, which defines the permutation matrix Pr;
6b33357c7561 Initial revision pkienzle parents: diff changeset	63 * perm_r[i] = j means row i of A is in position j in Pr*A.
6b33357c7561 Initial revision pkienzle parents: diff changeset	64 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	65 * perm_c (input) int*, dimension (A->ncol)
6b33357c7561 Initial revision pkienzle parents: diff changeset	66 * Column permutation vector, which defines the
6b33357c7561 Initial revision pkienzle parents: diff changeset	67 * permutation matrix Pc; perm_c[i] = j means column i of A is
6b33357c7561 Initial revision pkienzle parents: diff changeset	68 * in position j in A*Pc.
6b33357c7561 Initial revision pkienzle parents: diff changeset	69 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	70 * equed (input) Specifies the form of equilibration that was done.
6b33357c7561 Initial revision pkienzle parents: diff changeset	71 * = 'N': No equilibration.
6b33357c7561 Initial revision pkienzle parents: diff changeset	72 * = 'R': Row equilibration, i.e., A was premultiplied by diag(R).
6b33357c7561 Initial revision pkienzle parents: diff changeset	73 * = 'C': Column equilibration, i.e., A was postmultiplied by
6b33357c7561 Initial revision pkienzle parents: diff changeset	74 * diag(C).
6b33357c7561 Initial revision pkienzle parents: diff changeset	75 * = 'B': Both row and column equilibration, i.e., A was replaced
6b33357c7561 Initial revision pkienzle parents: diff changeset	76 * by diag(R)Adiag(C).
6b33357c7561 Initial revision pkienzle parents: diff changeset	77 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	78 * R (input) double*, dimension (A->nrow)
6b33357c7561 Initial revision pkienzle parents: diff changeset	79 * The row scale factors for A.
6b33357c7561 Initial revision pkienzle parents: diff changeset	80 * If equed = 'R' or 'B', A is premultiplied by diag(R).
6b33357c7561 Initial revision pkienzle parents: diff changeset	81 * If equed = 'N' or 'C', R is not accessed.
6b33357c7561 Initial revision pkienzle parents: diff changeset	82 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	83 * C (input) double*, dimension (A->ncol)
6b33357c7561 Initial revision pkienzle parents: diff changeset	84 * The column scale factors for A.
6b33357c7561 Initial revision pkienzle parents: diff changeset	85 * If equed = 'C' or 'B', A is postmultiplied by diag(C).
6b33357c7561 Initial revision pkienzle parents: diff changeset	86 * If equed = 'N' or 'R', C is not accessed.
6b33357c7561 Initial revision pkienzle parents: diff changeset	87 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	88 * B (input) SuperMatrix*
6b33357c7561 Initial revision pkienzle parents: diff changeset	89 * B has types: Stype = DN, Dtype = _Z, Mtype = GE.
6b33357c7561 Initial revision pkienzle parents: diff changeset	90 * The right hand side matrix B.
6b33357c7561 Initial revision pkienzle parents: diff changeset	91 * if equed = 'R' or 'B', B is premultiplied by diag(R).
6b33357c7561 Initial revision pkienzle parents: diff changeset	92 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	93 * X (input/output) SuperMatrix*
6b33357c7561 Initial revision pkienzle parents: diff changeset	94 * X has types: Stype = DN, Dtype = _Z, Mtype = GE.
6b33357c7561 Initial revision pkienzle parents: diff changeset	95 * On entry, the solution matrix X, as computed by zgstrs().
6b33357c7561 Initial revision pkienzle parents: diff changeset	96 * On exit, the improved solution matrix X.
6b33357c7561 Initial revision pkienzle parents: diff changeset	97 * if *equed = 'C' or 'B', X should be premultiplied by diag(C)
6b33357c7561 Initial revision pkienzle parents: diff changeset	98 * in order to obtain the solution to the original system.
6b33357c7561 Initial revision pkienzle parents: diff changeset	99 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	100 * FERR (output) double*, dimension (B->ncol)
6b33357c7561 Initial revision pkienzle parents: diff changeset	101 * The estimated forward error bound for each solution vector
6b33357c7561 Initial revision pkienzle parents: diff changeset	102 * X(j) (the j-th column of the solution matrix X).
6b33357c7561 Initial revision pkienzle parents: diff changeset	103 * If XTRUE is the true solution corresponding to X(j), FERR(j)
6b33357c7561 Initial revision pkienzle parents: diff changeset	104 * is an estimated upper bound for the magnitude of the largest
6b33357c7561 Initial revision pkienzle parents: diff changeset	105 * element in (X(j) - XTRUE) divided by the magnitude of the
6b33357c7561 Initial revision pkienzle parents: diff changeset	106 * largest element in X(j). The estimate is as reliable as
6b33357c7561 Initial revision pkienzle parents: diff changeset	107 * the estimate for RCOND, and is almost always a slight
6b33357c7561 Initial revision pkienzle parents: diff changeset	108 * overestimate of the true error.
6b33357c7561 Initial revision pkienzle parents: diff changeset	109 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	110 * BERR (output) double*, dimension (B->ncol)
6b33357c7561 Initial revision pkienzle parents: diff changeset	111 * The componentwise relative backward error of each solution
6b33357c7561 Initial revision pkienzle parents: diff changeset	112 * vector X(j) (i.e., the smallest relative change in
6b33357c7561 Initial revision pkienzle parents: diff changeset	113 * any element of A or B that makes X(j) an exact solution).
6b33357c7561 Initial revision pkienzle parents: diff changeset	114 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	115 * info (output) int*
6b33357c7561 Initial revision pkienzle parents: diff changeset	116 * = 0: successful exit
6b33357c7561 Initial revision pkienzle parents: diff changeset	117 * < 0: if INFO = -i, the i-th argument had an illegal value
6b33357c7561 Initial revision pkienzle parents: diff changeset	118 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	119 * Internal Parameters
6b33357c7561 Initial revision pkienzle parents: diff changeset	120 * ===================
6b33357c7561 Initial revision pkienzle parents: diff changeset	121 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	122 * ITMAX is the maximum number of steps of iterative refinement.
6b33357c7561 Initial revision pkienzle parents: diff changeset	123 *
6b33357c7561 Initial revision pkienzle parents: diff changeset	124 */
6b33357c7561 Initial revision pkienzle parents: diff changeset	125
6b33357c7561 Initial revision pkienzle parents: diff changeset	126 #define ITMAX 5
6b33357c7561 Initial revision pkienzle parents: diff changeset	127
6b33357c7561 Initial revision pkienzle parents: diff changeset	128 /* Table of constant values */
6b33357c7561 Initial revision pkienzle parents: diff changeset	129 int ione = 1;
6b33357c7561 Initial revision pkienzle parents: diff changeset	130 doublecomplex ndone = {-1., 0.};
6b33357c7561 Initial revision pkienzle parents: diff changeset	131 doublecomplex done = {1., 0.};
6b33357c7561 Initial revision pkienzle parents: diff changeset	132
6b33357c7561 Initial revision pkienzle parents: diff changeset	133 /* Local variables */
6b33357c7561 Initial revision pkienzle parents: diff changeset	134 NCformat *Astore;
6b33357c7561 Initial revision pkienzle parents: diff changeset	135 doublecomplex *Aval;
6b33357c7561 Initial revision pkienzle parents: diff changeset	136 SuperMatrix Bjcol;
6b33357c7561 Initial revision pkienzle parents: diff changeset	137 DNformat Bstore, Xstore, *Bjcol_store;
6b33357c7561 Initial revision pkienzle parents: diff changeset	138 doublecomplex Bmat, Xmat, Bptr, Xptr;
6b33357c7561 Initial revision pkienzle parents: diff changeset	139 int kase;
6b33357c7561 Initial revision pkienzle parents: diff changeset	140 double safe1, safe2;
6b33357c7561 Initial revision pkienzle parents: diff changeset	141 int i, j, k, irow, nz, count, notran, rowequ, colequ;
6b33357c7561 Initial revision pkienzle parents: diff changeset	142 int ldb, ldx, nrhs;
6b33357c7561 Initial revision pkienzle parents: diff changeset	143 double s, xk, lstres, eps, safmin;
6b33357c7561 Initial revision pkienzle parents: diff changeset	144 char transt[1];
6b33357c7561 Initial revision pkienzle parents: diff changeset	145 doublecomplex *work;
6b33357c7561 Initial revision pkienzle parents: diff changeset	146 double *rwork;
6b33357c7561 Initial revision pkienzle parents: diff changeset	147 int *iwork;
6b33357c7561 Initial revision pkienzle parents: diff changeset	148 extern double dlamch_(char *);
6b33357c7561 Initial revision pkienzle parents: diff changeset	149 extern int zlacon_(int , doublecomplex , doublecomplex , double , int *);
6b33357c7561 Initial revision pkienzle parents: diff changeset	150 #ifdef _CRAY
6b33357c7561 Initial revision pkienzle parents: diff changeset	151 extern int CCOPY(int , doublecomplex , int , doublecomplex , int *);
6b33357c7561 Initial revision pkienzle parents: diff changeset	152 extern int CSAXPY(int , doublecomplex , doublecomplex , int , doublecomplex , int );
6b33357c7561 Initial revision pkienzle parents: diff changeset	153 #else
6b33357c7561 Initial revision pkienzle parents: diff changeset	154 extern int zcopy_(int , doublecomplex , int , doublecomplex , int *);
6b33357c7561 Initial revision pkienzle parents: diff changeset	155 extern int zaxpy_(int , doublecomplex , doublecomplex , int , doublecomplex , int );
6b33357c7561 Initial revision pkienzle parents: diff changeset	156 #endif
6b33357c7561 Initial revision pkienzle parents: diff changeset	157
6b33357c7561 Initial revision pkienzle parents: diff changeset	158 Astore = A->Store;
6b33357c7561 Initial revision pkienzle parents: diff changeset	159 Aval = Astore->nzval;
6b33357c7561 Initial revision pkienzle parents: diff changeset	160 Bstore = B->Store;
6b33357c7561 Initial revision pkienzle parents: diff changeset	161 Xstore = X->Store;
6b33357c7561 Initial revision pkienzle parents: diff changeset	162 Bmat = Bstore->nzval;
6b33357c7561 Initial revision pkienzle parents: diff changeset	163 Xmat = Xstore->nzval;
6b33357c7561 Initial revision pkienzle parents: diff changeset	164 ldb = Bstore->lda;
6b33357c7561 Initial revision pkienzle parents: diff changeset	165 ldx = Xstore->lda;
6b33357c7561 Initial revision pkienzle parents: diff changeset	166 nrhs = B->ncol;
6b33357c7561 Initial revision pkienzle parents: diff changeset	167
6b33357c7561 Initial revision pkienzle parents: diff changeset	168 /* Test the input parameters */
6b33357c7561 Initial revision pkienzle parents: diff changeset	169 *info = 0;
6b33357c7561 Initial revision pkienzle parents: diff changeset	170 notran = lsame_(trans, "N");
6b33357c7561 Initial revision pkienzle parents: diff changeset	171 if ( !notran && !lsame_(trans, "T") && !lsame_(trans, "C")) *info = -1;
6b33357c7561 Initial revision pkienzle parents: diff changeset	172 else if ( A->nrow != A->ncol \|\| A->nrow < 0 \|\|
6b33357c7561 Initial revision pkienzle parents: diff changeset	173 A->Stype != NC \|\| A->Dtype != _Z \|\| A->Mtype != GE )
6b33357c7561 Initial revision pkienzle parents: diff changeset	174 *info = -2;
6b33357c7561 Initial revision pkienzle parents: diff changeset	175 else if ( L->nrow != L->ncol \|\| L->nrow < 0 \|\|
6b33357c7561 Initial revision pkienzle parents: diff changeset	176 L->Stype != SC \|\| L->Dtype != _Z \|\| L->Mtype != TRLU )
6b33357c7561 Initial revision pkienzle parents: diff changeset	177 *info = -3;
6b33357c7561 Initial revision pkienzle parents: diff changeset	178 else if ( U->nrow != U->ncol \|\| U->nrow < 0 \|\|
6b33357c7561 Initial revision pkienzle parents: diff changeset	179 U->Stype != NC \|\| U->Dtype != _Z \|\| U->Mtype != TRU )
6b33357c7561 Initial revision pkienzle parents: diff changeset	180 *info = -4;
6b33357c7561 Initial revision pkienzle parents: diff changeset	181 else if ( ldb < MAX(0, A->nrow) \|\|
6b33357c7561 Initial revision pkienzle parents: diff changeset	182 B->Stype != DN \|\| B->Dtype != _Z \|\| B->Mtype != GE )
6b33357c7561 Initial revision pkienzle parents: diff changeset	183 *info = -10;
6b33357c7561 Initial revision pkienzle parents: diff changeset	184 else if ( ldx < MAX(0, A->nrow) \|\|
6b33357c7561 Initial revision pkienzle parents: diff changeset	185 X->Stype != DN \|\| X->Dtype != _Z \|\| X->Mtype != GE )
6b33357c7561 Initial revision pkienzle parents: diff changeset	186 *info = -11;
6b33357c7561 Initial revision pkienzle parents: diff changeset	187 if (*info != 0) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	188 i = -(*info);
6b33357c7561 Initial revision pkienzle parents: diff changeset	189 xerbla_("zgsrfs", &i);
6b33357c7561 Initial revision pkienzle parents: diff changeset	190 return;
6b33357c7561 Initial revision pkienzle parents: diff changeset	191 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	192
6b33357c7561 Initial revision pkienzle parents: diff changeset	193 /* Quick return if possible */
6b33357c7561 Initial revision pkienzle parents: diff changeset	194 if ( A->nrow == 0 \|\| nrhs == 0) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	195 for (j = 0; j < nrhs; ++j) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	196 ferr[j] = 0.;
6b33357c7561 Initial revision pkienzle parents: diff changeset	197 berr[j] = 0.;
6b33357c7561 Initial revision pkienzle parents: diff changeset	198 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	199 return;
6b33357c7561 Initial revision pkienzle parents: diff changeset	200 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	201
6b33357c7561 Initial revision pkienzle parents: diff changeset	202 rowequ = lsame_(equed, "R") \|\| lsame_(equed, "B");
6b33357c7561 Initial revision pkienzle parents: diff changeset	203 colequ = lsame_(equed, "C") \|\| lsame_(equed, "B");
6b33357c7561 Initial revision pkienzle parents: diff changeset	204
6b33357c7561 Initial revision pkienzle parents: diff changeset	205 /* Allocate working space */
6b33357c7561 Initial revision pkienzle parents: diff changeset	206 work = doublecomplexMalloc(2*A->nrow);
6b33357c7561 Initial revision pkienzle parents: diff changeset	207 rwork = (double ) SUPERLU_MALLOC( A->nrow sizeof(double) );
6b33357c7561 Initial revision pkienzle parents: diff changeset	208 iwork = intMalloc(A->nrow);
6b33357c7561 Initial revision pkienzle parents: diff changeset	209 if ( !work \|\| !rwork \|\| !iwork )
6b33357c7561 Initial revision pkienzle parents: diff changeset	210 ABORT("Malloc fails for work/rwork/iwork.");
6b33357c7561 Initial revision pkienzle parents: diff changeset	211
6b33357c7561 Initial revision pkienzle parents: diff changeset	212 if ( notran ) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	213 (unsigned char )transt = 'T';
6b33357c7561 Initial revision pkienzle parents: diff changeset	214 } else {
6b33357c7561 Initial revision pkienzle parents: diff changeset	215 (unsigned char )transt = 'N';
6b33357c7561 Initial revision pkienzle parents: diff changeset	216 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	217
6b33357c7561 Initial revision pkienzle parents: diff changeset	218 /* NZ = maximum number of nonzero elements in each row of A, plus 1 */
6b33357c7561 Initial revision pkienzle parents: diff changeset	219 nz = A->ncol + 1;
6b33357c7561 Initial revision pkienzle parents: diff changeset	220 eps = dlamch_("Epsilon");
6b33357c7561 Initial revision pkienzle parents: diff changeset	221 safmin = dlamch_("Safe minimum");
6b33357c7561 Initial revision pkienzle parents: diff changeset	222 safe1 = nz * safmin;
6b33357c7561 Initial revision pkienzle parents: diff changeset	223 safe2 = safe1 / eps;
6b33357c7561 Initial revision pkienzle parents: diff changeset	224
6b33357c7561 Initial revision pkienzle parents: diff changeset	225 /* Compute the number of nonzeros in each row (or column) of A */
6b33357c7561 Initial revision pkienzle parents: diff changeset	226 for (i = 0; i < A->nrow; ++i) iwork[i] = 0;
6b33357c7561 Initial revision pkienzle parents: diff changeset	227 if ( notran ) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	228 for (k = 0; k < A->ncol; ++k)
6b33357c7561 Initial revision pkienzle parents: diff changeset	229 for (i = Astore->colptr[k]; i < Astore->colptr[k+1]; ++i)
6b33357c7561 Initial revision pkienzle parents: diff changeset	230 ++iwork[Astore->rowind[i]];
6b33357c7561 Initial revision pkienzle parents: diff changeset	231 } else {
6b33357c7561 Initial revision pkienzle parents: diff changeset	232 for (k = 0; k < A->ncol; ++k)
6b33357c7561 Initial revision pkienzle parents: diff changeset	233 iwork[k] = Astore->colptr[k+1] - Astore->colptr[k];
6b33357c7561 Initial revision pkienzle parents: diff changeset	234 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	235
6b33357c7561 Initial revision pkienzle parents: diff changeset	236 /* Copy one column of RHS B into Bjcol. */
6b33357c7561 Initial revision pkienzle parents: diff changeset	237 Bjcol.Stype = B->Stype;
6b33357c7561 Initial revision pkienzle parents: diff changeset	238 Bjcol.Dtype = B->Dtype;
6b33357c7561 Initial revision pkienzle parents: diff changeset	239 Bjcol.Mtype = B->Mtype;
6b33357c7561 Initial revision pkienzle parents: diff changeset	240 Bjcol.nrow = B->nrow;
6b33357c7561 Initial revision pkienzle parents: diff changeset	241 Bjcol.ncol = 1;
6b33357c7561 Initial revision pkienzle parents: diff changeset	242 Bjcol.Store = (void *) SUPERLU_MALLOC( sizeof(DNformat) );
6b33357c7561 Initial revision pkienzle parents: diff changeset	243 if ( !Bjcol.Store ) ABORT("SUPERLU_MALLOC fails for Bjcol.Store");
6b33357c7561 Initial revision pkienzle parents: diff changeset	244 Bjcol_store = Bjcol.Store;
6b33357c7561 Initial revision pkienzle parents: diff changeset	245 Bjcol_store->lda = ldb;
6b33357c7561 Initial revision pkienzle parents: diff changeset	246 Bjcol_store->nzval = work; /* address aliasing */
6b33357c7561 Initial revision pkienzle parents: diff changeset	247
6b33357c7561 Initial revision pkienzle parents: diff changeset	248 /* Do for each right hand side ... */
6b33357c7561 Initial revision pkienzle parents: diff changeset	249 for (j = 0; j < nrhs; ++j) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	250 count = 0;
6b33357c7561 Initial revision pkienzle parents: diff changeset	251 lstres = 3.;
6b33357c7561 Initial revision pkienzle parents: diff changeset	252 Bptr = &Bmat[j*ldb];
6b33357c7561 Initial revision pkienzle parents: diff changeset	253 Xptr = &Xmat[j*ldx];
6b33357c7561 Initial revision pkienzle parents: diff changeset	254
6b33357c7561 Initial revision pkienzle parents: diff changeset	255 while (1) { /* Loop until stopping criterion is satisfied. */
6b33357c7561 Initial revision pkienzle parents: diff changeset	256
6b33357c7561 Initial revision pkienzle parents: diff changeset	257 /* Compute residual R = B - op(A) * X,
6b33357c7561 Initial revision pkienzle parents: diff changeset	258 where op(A) = A, AT, or AH, depending on TRANS. */
6b33357c7561 Initial revision pkienzle parents: diff changeset	259
6b33357c7561 Initial revision pkienzle parents: diff changeset	260 #ifdef _CRAY
6b33357c7561 Initial revision pkienzle parents: diff changeset	261 CCOPY(&A->nrow, Bptr, &ione, work, &ione);
6b33357c7561 Initial revision pkienzle parents: diff changeset	262 #else
6b33357c7561 Initial revision pkienzle parents: diff changeset	263 zcopy_(&A->nrow, Bptr, &ione, work, &ione);
6b33357c7561 Initial revision pkienzle parents: diff changeset	264 #endif
6b33357c7561 Initial revision pkienzle parents: diff changeset	265 sp_zgemv(trans, ndone, A, Xptr, ione, done, work, ione);
6b33357c7561 Initial revision pkienzle parents: diff changeset	266
6b33357c7561 Initial revision pkienzle parents: diff changeset	267 /* Compute componentwise relative backward error from formula
6b33357c7561 Initial revision pkienzle parents: diff changeset	268 max(i) ( abs(R(i)) / ( abs(op(A))*abs(X) + abs(B) )(i) )
6b33357c7561 Initial revision pkienzle parents: diff changeset	269 where abs(Z) is the componentwise absolute value of the matrix
6b33357c7561 Initial revision pkienzle parents: diff changeset	270 or vector Z. If the i-th component of the denominator is less
6b33357c7561 Initial revision pkienzle parents: diff changeset	271 than SAFE2, then SAFE1 is added to the i-th component of the
6b33357c7561 Initial revision pkienzle parents: diff changeset	272 numerator and denominator before dividing. */
6b33357c7561 Initial revision pkienzle parents: diff changeset	273
6b33357c7561 Initial revision pkienzle parents: diff changeset	274 for (i = 0; i < A->nrow; ++i) rwork[i] = z_abs1( &Bptr[i] );
6b33357c7561 Initial revision pkienzle parents: diff changeset	275
6b33357c7561 Initial revision pkienzle parents: diff changeset	276 /* Compute abs(op(A))abs(X) + abs(B). /
6b33357c7561 Initial revision pkienzle parents: diff changeset	277 if (notran) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	278 for (k = 0; k < A->ncol; ++k) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	279 xk = z_abs1( &Xptr[k] );
6b33357c7561 Initial revision pkienzle parents: diff changeset	280 for (i = Astore->colptr[k]; i < Astore->colptr[k+1]; ++i)
6b33357c7561 Initial revision pkienzle parents: diff changeset	281 rwork[Astore->rowind[i]] += z_abs1(&Aval[i]) * xk;
6b33357c7561 Initial revision pkienzle parents: diff changeset	282 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	283 } else {
6b33357c7561 Initial revision pkienzle parents: diff changeset	284 for (k = 0; k < A->ncol; ++k) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	285 s = 0.;
6b33357c7561 Initial revision pkienzle parents: diff changeset	286 for (i = Astore->colptr[k]; i < Astore->colptr[k+1]; ++i) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	287 irow = Astore->rowind[i];
6b33357c7561 Initial revision pkienzle parents: diff changeset	288 s += z_abs1(&Aval[i]) * z_abs1(&Xptr[irow]);
6b33357c7561 Initial revision pkienzle parents: diff changeset	289 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	290 rwork[k] += s;
6b33357c7561 Initial revision pkienzle parents: diff changeset	291 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	292 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	293 s = 0.;
6b33357c7561 Initial revision pkienzle parents: diff changeset	294 for (i = 0; i < A->nrow; ++i) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	295 if (rwork[i] > safe2)
6b33357c7561 Initial revision pkienzle parents: diff changeset	296 s = MAX( s, z_abs1(&work[i]) / rwork[i] );
6b33357c7561 Initial revision pkienzle parents: diff changeset	297 else
6b33357c7561 Initial revision pkienzle parents: diff changeset	298 s = MAX( s, (z_abs1(&work[i]) + safe1) /
6b33357c7561 Initial revision pkienzle parents: diff changeset	299 (rwork[i] + safe1) );
6b33357c7561 Initial revision pkienzle parents: diff changeset	300 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	301 berr[j] = s;
6b33357c7561 Initial revision pkienzle parents: diff changeset	302
6b33357c7561 Initial revision pkienzle parents: diff changeset	303 /* Test stopping criterion. Continue iterating if
6b33357c7561 Initial revision pkienzle parents: diff changeset	304 1) The residual BERR(J) is larger than machine epsilon, and
6b33357c7561 Initial revision pkienzle parents: diff changeset	305 2) BERR(J) decreased by at least a factor of 2 during the
6b33357c7561 Initial revision pkienzle parents: diff changeset	306 last iteration, and
6b33357c7561 Initial revision pkienzle parents: diff changeset	307 3) At most ITMAX iterations tried. */
6b33357c7561 Initial revision pkienzle parents: diff changeset	308
6b33357c7561 Initial revision pkienzle parents: diff changeset	309 if (berr[j] > eps && berr[j] * 2. <= lstres && count < ITMAX) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	310 /* Update solution and try again. */
6b33357c7561 Initial revision pkienzle parents: diff changeset	311 zgstrs (trans, L, U, perm_r, perm_c, &Bjcol, info);
6b33357c7561 Initial revision pkienzle parents: diff changeset	312
6b33357c7561 Initial revision pkienzle parents: diff changeset	313 #ifdef _CRAY
6b33357c7561 Initial revision pkienzle parents: diff changeset	314 CAXPY(&A->nrow, &done, work, &ione,
6b33357c7561 Initial revision pkienzle parents: diff changeset	315 &Xmat[j*ldx], &ione);
6b33357c7561 Initial revision pkienzle parents: diff changeset	316 #else
6b33357c7561 Initial revision pkienzle parents: diff changeset	317 zaxpy_(&A->nrow, &done, work, &ione,
6b33357c7561 Initial revision pkienzle parents: diff changeset	318 &Xmat[j*ldx], &ione);
6b33357c7561 Initial revision pkienzle parents: diff changeset	319 #endif
6b33357c7561 Initial revision pkienzle parents: diff changeset	320 lstres = berr[j];
6b33357c7561 Initial revision pkienzle parents: diff changeset	321 ++count;
6b33357c7561 Initial revision pkienzle parents: diff changeset	322 } else {
6b33357c7561 Initial revision pkienzle parents: diff changeset	323 break;
6b33357c7561 Initial revision pkienzle parents: diff changeset	324 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	325
6b33357c7561 Initial revision pkienzle parents: diff changeset	326 } /* end while */
6b33357c7561 Initial revision pkienzle parents: diff changeset	327
6b33357c7561 Initial revision pkienzle parents: diff changeset	328 /* Bound error from formula:
6b33357c7561 Initial revision pkienzle parents: diff changeset	329 norm(X - XTRUE) / norm(X) .le. FERR = norm( abs(inv(op(A)))*
6b33357c7561 Initial revision pkienzle parents: diff changeset	330 ( abs(R) + NZEPS( abs(op(A))*abs(X)+abs(B) ))) / norm(X)
6b33357c7561 Initial revision pkienzle parents: diff changeset	331 where
6b33357c7561 Initial revision pkienzle parents: diff changeset	332 norm(Z) is the magnitude of the largest component of Z
6b33357c7561 Initial revision pkienzle parents: diff changeset	333 inv(op(A)) is the inverse of op(A)
6b33357c7561 Initial revision pkienzle parents: diff changeset	334 abs(Z) is the componentwise absolute value of the matrix or
6b33357c7561 Initial revision pkienzle parents: diff changeset	335 vector Z
6b33357c7561 Initial revision pkienzle parents: diff changeset	336 NZ is the maximum number of nonzeros in any row of A, plus 1
6b33357c7561 Initial revision pkienzle parents: diff changeset	337 EPS is machine epsilon
6b33357c7561 Initial revision pkienzle parents: diff changeset	338
6b33357c7561 Initial revision pkienzle parents: diff changeset	339 The i-th component of abs(R)+NZEPS(abs(op(A))*abs(X)+abs(B))
6b33357c7561 Initial revision pkienzle parents: diff changeset	340 is incremented by SAFE1 if the i-th component of
6b33357c7561 Initial revision pkienzle parents: diff changeset	341 abs(op(A))*abs(X) + abs(B) is less than SAFE2.
6b33357c7561 Initial revision pkienzle parents: diff changeset	342
6b33357c7561 Initial revision pkienzle parents: diff changeset	343 Use ZLACON to estimate the infinity-norm of the matrix
6b33357c7561 Initial revision pkienzle parents: diff changeset	344 inv(op(A)) * diag(W),
6b33357c7561 Initial revision pkienzle parents: diff changeset	345 where W = abs(R) + NZEPS( abs(op(A))abs(X)+abs(B) ))) /
6b33357c7561 Initial revision pkienzle parents: diff changeset	346
6b33357c7561 Initial revision pkienzle parents: diff changeset	347 for (i = 0; i < A->nrow; ++i) rwork[i] = z_abs1( &Bptr[i] );
6b33357c7561 Initial revision pkienzle parents: diff changeset	348
6b33357c7561 Initial revision pkienzle parents: diff changeset	349 /* Compute abs(op(A))abs(X) + abs(B). /
6b33357c7561 Initial revision pkienzle parents: diff changeset	350 if ( notran ) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	351 for (k = 0; k < A->ncol; ++k) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	352 xk = z_abs1( &Xptr[k] );
6b33357c7561 Initial revision pkienzle parents: diff changeset	353 for (i = Astore->colptr[k]; i < Astore->colptr[k+1]; ++i)
6b33357c7561 Initial revision pkienzle parents: diff changeset	354 rwork[Astore->rowind[i]] += z_abs1(&Aval[i]) * xk;
6b33357c7561 Initial revision pkienzle parents: diff changeset	355 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	356 } else {
6b33357c7561 Initial revision pkienzle parents: diff changeset	357 for (k = 0; k < A->ncol; ++k) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	358 s = 0.;
6b33357c7561 Initial revision pkienzle parents: diff changeset	359 for (i = Astore->colptr[k]; i < Astore->colptr[k+1]; ++i) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	360 irow = Astore->rowind[i];
6b33357c7561 Initial revision pkienzle parents: diff changeset	361 xk = z_abs1( &Xptr[irow] );
6b33357c7561 Initial revision pkienzle parents: diff changeset	362 s += z_abs1(&Aval[i]) * xk;
6b33357c7561 Initial revision pkienzle parents: diff changeset	363 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	364 rwork[k] += s;
6b33357c7561 Initial revision pkienzle parents: diff changeset	365 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	366 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	367
6b33357c7561 Initial revision pkienzle parents: diff changeset	368 for (i = 0; i < A->nrow; ++i)
6b33357c7561 Initial revision pkienzle parents: diff changeset	369 if (rwork[i] > safe2)
6b33357c7561 Initial revision pkienzle parents: diff changeset	370 rwork[i] = z_abs(&work[i]) + (iwork[i]+1)epsrwork[i];
6b33357c7561 Initial revision pkienzle parents: diff changeset	371 else
6b33357c7561 Initial revision pkienzle parents: diff changeset	372 rwork[i] = z_abs(&work[i])+(iwork[i]+1)epsrwork[i]+safe1;
6b33357c7561 Initial revision pkienzle parents: diff changeset	373 kase = 0;
6b33357c7561 Initial revision pkienzle parents: diff changeset	374
6b33357c7561 Initial revision pkienzle parents: diff changeset	375 do {
6b33357c7561 Initial revision pkienzle parents: diff changeset	376 zlacon_(&A->nrow, &work[A->nrow], work,
6b33357c7561 Initial revision pkienzle parents: diff changeset	377 &ferr[j], &kase);
6b33357c7561 Initial revision pkienzle parents: diff changeset	378 if (kase == 0) break;
6b33357c7561 Initial revision pkienzle parents: diff changeset	379
6b33357c7561 Initial revision pkienzle parents: diff changeset	380 if (kase == 1) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	381 /* Multiply by diag(W)inv(op(A)T)(diag(C) or diag(R)). */
6b33357c7561 Initial revision pkienzle parents: diff changeset	382 if ( notran && colequ )
6b33357c7561 Initial revision pkienzle parents: diff changeset	383 for (i = 0; i < A->ncol; ++i) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	384 zd_mult(&work[i], &work[i], C[i]);
6b33357c7561 Initial revision pkienzle parents: diff changeset	385 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	386 else if ( !notran && rowequ )
6b33357c7561 Initial revision pkienzle parents: diff changeset	387 for (i = 0; i < A->nrow; ++i) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	388 zd_mult(&work[i], &work[i], R[i]);
6b33357c7561 Initial revision pkienzle parents: diff changeset	389 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	390
6b33357c7561 Initial revision pkienzle parents: diff changeset	391 zgstrs (transt, L, U, perm_r, perm_c, &Bjcol, info);
6b33357c7561 Initial revision pkienzle parents: diff changeset	392
6b33357c7561 Initial revision pkienzle parents: diff changeset	393 for (i = 0; i < A->nrow; ++i) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	394 zd_mult(&work[i], &work[i], rwork[i]);
6b33357c7561 Initial revision pkienzle parents: diff changeset	395 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	396 } else {
6b33357c7561 Initial revision pkienzle parents: diff changeset	397 /* Multiply by (diag(C) or diag(R))inv(op(A))diag(W). */
6b33357c7561 Initial revision pkienzle parents: diff changeset	398 for (i = 0; i < A->nrow; ++i) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	399 zd_mult(&work[i], &work[i], rwork[i]);
6b33357c7561 Initial revision pkienzle parents: diff changeset	400 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	401
6b33357c7561 Initial revision pkienzle parents: diff changeset	402 zgstrs (trans, L, U, perm_r, perm_c, &Bjcol, info);
6b33357c7561 Initial revision pkienzle parents: diff changeset	403
6b33357c7561 Initial revision pkienzle parents: diff changeset	404 if ( notran && colequ )
6b33357c7561 Initial revision pkienzle parents: diff changeset	405 for (i = 0; i < A->ncol; ++i) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	406 zd_mult(&work[i], &work[i], C[i]);
6b33357c7561 Initial revision pkienzle parents: diff changeset	407 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	408 else if ( !notran && rowequ )
6b33357c7561 Initial revision pkienzle parents: diff changeset	409 for (i = 0; i < A->ncol; ++i) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	410 zd_mult(&work[i], &work[i], R[i]);
6b33357c7561 Initial revision pkienzle parents: diff changeset	411 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	412 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	413
6b33357c7561 Initial revision pkienzle parents: diff changeset	414 } while ( kase != 0 );
6b33357c7561 Initial revision pkienzle parents: diff changeset	415
6b33357c7561 Initial revision pkienzle parents: diff changeset	416 /* Normalize error. */
6b33357c7561 Initial revision pkienzle parents: diff changeset	417 lstres = 0.;
6b33357c7561 Initial revision pkienzle parents: diff changeset	418 if ( notran && colequ ) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	419 for (i = 0; i < A->nrow; ++i)
6b33357c7561 Initial revision pkienzle parents: diff changeset	420 lstres = MAX( lstres, C[i] * z_abs1( &Xptr[i]) );
6b33357c7561 Initial revision pkienzle parents: diff changeset	421 } else if ( !notran && rowequ ) {
6b33357c7561 Initial revision pkienzle parents: diff changeset	422 for (i = 0; i < A->nrow; ++i)
6b33357c7561 Initial revision pkienzle parents: diff changeset	423 lstres = MAX( lstres, R[i] * z_abs1( &Xptr[i]) );
6b33357c7561 Initial revision pkienzle parents: diff changeset	424 } else {
6b33357c7561 Initial revision pkienzle parents: diff changeset	425 for (i = 0; i < A->nrow; ++i)
6b33357c7561 Initial revision pkienzle parents: diff changeset	426 lstres = MAX( lstres, z_abs1( &Xptr[i]) );
6b33357c7561 Initial revision pkienzle parents: diff changeset	427 }
6b33357c7561 Initial revision pkienzle parents: diff changeset	428 if ( lstres != 0. )
6b33357c7561 Initial revision pkienzle parents: diff changeset	429 ferr[j] /= lstres;
6b33357c7561 Initial revision pkienzle parents: diff changeset	430
6b33357c7561 Initial revision pkienzle parents: diff changeset	431 } /* for each RHS j ... */
6b33357c7561 Initial revision pkienzle parents: diff changeset	432
6b33357c7561 Initial revision pkienzle parents: diff changeset	433 SUPERLU_FREE(work);
6b33357c7561 Initial revision pkienzle parents: diff changeset	434 SUPERLU_FREE(rwork);
6b33357c7561 Initial revision pkienzle parents: diff changeset	435 SUPERLU_FREE(iwork);
6b33357c7561 Initial revision pkienzle parents: diff changeset	436 SUPERLU_FREE(Bjcol.Store);
6b33357c7561 Initial revision pkienzle parents: diff changeset	437
6b33357c7561 Initial revision pkienzle parents: diff changeset	438 return;
6b33357c7561 Initial revision pkienzle parents: diff changeset	439
6b33357c7561 Initial revision pkienzle parents: diff changeset	440 } /* zgsrfs */

Mercurial > forge

annotate main/sparse/SuperLU/SRC/zgsrfs.c @ 0:6b33357c7561 octave-forge