d9/d92/clamsh_8f_source.html

      SUBROUTINE clamsh( S, LDS, NBULGE, JBLK, H, LDH, N, ULP )

*

*  -- ScaLAPACK routine (version 1.7) --

*     Univ. of Tennessee, Univ. of California Berkeley, NAG Ltd.,

*     Courant Institute, Argonne National Lab, and Rice University

*     May 28, 1999

*

*     .. Scalar Arguments ..

      INTEGER            JBLK, LDH, LDS, N, NBULGE

      REAL               ULP

*     ..

*     .. Array Arguments ..

      COMPLEX            H( LDH, * ), S( LDS, * )

*     ..

*

*  Purpose

*  =======

*

*  CLAMSH sends multiple shifts through a small (single node) matrix to

*     see how consecutive small subdiagonal elements are modified by

*     subsequent shifts in an effort to maximize the number of bulges

*     that can be sent through.

*  CLAMSH should only be called when there are multiple shifts/bulges

*     (NBULGE > 1) and the first shift is starting in the middle of an

*     unreduced Hessenberg matrix because of two or more consecutive

*     small subdiagonal elements.

*

*  Arguments

*  =========

*

*  S       (local input/output) COMPLEX array, ( LDS,* )

*          On entry, the matrix of shifts.  Only the 2x2 diagonal of S

*          is referenced.  It is assumed that S has JBLK double shifts

*             (size 2).

*          On exit, the data is rearranged in the best order for

*             applying.

*

*  LDS     (local input) INTEGER

*          On entry, the leading dimension of S.  Unchanged on exit.

*              1 < NBULGE <= JBLK <= LDS/2

*

*  NBULGE  (local input/output) INTEGER

*          On entry, the number of bulges to send through H ( >1 ).

*              NBULGE should be less than the maximum determined (JBLK).

*              1 < NBULGE <= JBLK <= LDS/2

*          On exit, the maximum number of bulges that can be sent

*              through.

*

*  JBLK    (local input) INTEGER

*          On entry, the number of shifts determined for S.

*          Unchanged on exit.

*

*  H       (local input/output) COMPLEX array ( LDH,N )

*          On entry, the local matrix to apply the shifts on.

*              H should be aligned so that the starting row is 2.

*          On exit, the data is destroyed.

*

*  LDH     (local input) INTEGER

*          On entry, the leading dimension of H.  Unchanged on exit.

*

*  N       (local input) INTEGER

*          On entry, the size of H.  If all the bulges are expected to

*              go through, N should be at least 4*NBULGE+2.

*              Otherwise, NBULGE may be reduced by this routine.

*

*  ULP     (local input) REAL

*          On entry, machine precision

*          Unchanged on exit.

*

*  Further Details

*  ===============

*

*  Implemented by:  M. Fahey, May 28, 1999

*

*  =====================================================================

*

*     .. Parameters ..

      REAL               RONE, TEN

      parameter( rone = 1.0e+0, ten = 10.0e+0 )

      COMPLEX            ZERO

      parameter( zero = ( 0.0e+0, 0.0e+0 ) )

*     ..

*     .. Local Scalars ..

      INTEGER            I, IBULGE, IVAL, J, K, M, NR

      REAL               DVAL, S1, TST1

      COMPLEX            CDUM, H00, H10, H11, H12, H21, H22, H33, H33S,

     $                   H43H34, H44, H44S, SUM, T1, T2, T3, V1, V2, V3

*     ..

*     .. Local Arrays ..

      COMPLEX            V( 3 )

*     ..

*     .. External Subroutines ..

      EXTERNAL           ccopy, clarfg

*     ..

*     .. Intrinsic Functions ..

      INTRINSIC          abs, real, conjg, aimag, max, min

*     ..

*     .. Statement Functions ..

      REAL               CABS1

*     ..

*     .. Statement Function definitions ..

      cabs1( cdum ) = abs( real( cdum ) ) + abs( aimag( cdum ) )

*     ..

*     .. Executable Statements ..

*

      m = 2

      DO 50 ibulge = 1, nbulge

         h44 = s( 2*jblk-2*ibulge+2, 2*jblk-2*ibulge+2 )

         h33 = s( 2*jblk-2*ibulge+1, 2*jblk-2*ibulge+1 )

         h43h34 = s( 2*jblk-2*ibulge+1, 2*jblk-2*ibulge+2 )*

     $            s( 2*jblk-2*ibulge+2, 2*jblk-2*ibulge+1 )

         h11 = h( m, m )

         h22 = h( m+1, m+1 )

         h21 = h( m+1, m )

         h12 = h( m, m+1 )

         h44s = h44 - h11

         h33s = h33 - h11

         v1 = ( h33s*h44s-h43h34 ) / h21 + h12

         v2 = h22 - h11 - h33s - h44s

         v3 = h( m+2, m+1 )

         s1 = cabs1( v1 ) + cabs1( v2 ) + cabs1( v3 )

         v1 = v1 / s1

         v2 = v2 / s1

         v3 = v3 / s1

         v( 1 ) = v1

         v( 2 ) = v2

         v( 3 ) = v3

         h00 = h( m-1, m-1 )

         h10 = h( m, m-1 )

         tst1 = cabs1( v1 )*( cabs1( h00 )+cabs1( h11 )+cabs1( h22 ) )

         IF( cabs1( h10 )*( cabs1( v2 )+cabs1( v3 ) ).GT.ulp*tst1 ) THEN

*           Find minimum

            dval = ( cabs1( h10 )*( cabs1( v2 )+cabs1( v3 ) ) ) /

     $             ( ulp*tst1 )

            ival = ibulge

            DO 10 i = ibulge + 1, nbulge

               h44 = s( 2*jblk-2*i+2, 2*jblk-2*i+2 )

               h33 = s( 2*jblk-2*i+1, 2*jblk-2*i+1 )

               h43h34 = s( 2*jblk-2*i+1, 2*jblk-2*i+2 )*

     $                  s( 2*jblk-2*i+2, 2*jblk-2*i+1 )

               h11 = h( m, m )

               h22 = h( m+1, m+1 )

               h21 = h( m+1, m )

               h12 = h( m, m+1 )

               h44s = h44 - h11

               h33s = h33 - h11

               v1 = ( h33s*h44s-h43h34 ) / h21 + h12

               v2 = h22 - h11 - h33s - h44s

               v3 = h( m+2, m+1 )

               s1 = cabs1( v1 ) + cabs1( v2 ) + cabs1( v3 )

               v1 = v1 / s1

               v2 = v2 / s1

               v3 = v3 / s1

               v( 1 ) = v1

               v( 2 ) = v2

               v( 3 ) = v3

               h00 = h( m-1, m-1 )

               h10 = h( m, m-1 )

               tst1 = cabs1( v1 )*( cabs1( h00 )+cabs1( h11 )+

     $                cabs1( h22 ) )

               IF( ( dval.GT.( cabs1( h10 )*( cabs1( v2 )+

     $             cabs1( v3 ) ) ) / ( ulp*tst1 ) ) .AND.

     $             ( dval.GT.rone ) ) THEN

                  dval = ( cabs1( h10 )*( cabs1( v2 )+cabs1( v3 ) ) ) /

     $                   ( ulp*tst1 )

                  ival = i

               END IF

   10       CONTINUE

            IF( ( dval.LT.ten ) .AND. ( ival.NE.ibulge ) ) THEN

               h44 = s( 2*jblk-2*ival+2, 2*jblk-2*ival+2 )

               h33 = s( 2*jblk-2*ival+1, 2*jblk-2*ival+1 )

               h43h34 = s( 2*jblk-2*ival+1, 2*jblk-2*ival+2 )

               h10 = s( 2*jblk-2*ival+2, 2*jblk-2*ival+1 )

               s( 2*jblk-2*ival+2, 2*jblk-2*ival+2 ) = s( 2*jblk-2*

     $            ibulge+2, 2*jblk-2*ibulge+2 )

               s( 2*jblk-2*ival+1, 2*jblk-2*ival+1 ) = s( 2*jblk-2*

     $            ibulge+1, 2*jblk-2*ibulge+1 )

               s( 2*jblk-2*ival+1, 2*jblk-2*ival+2 ) = s( 2*jblk-2*

     $            ibulge+1, 2*jblk-2*ibulge+2 )

               s( 2*jblk-2*ival+2, 2*jblk-2*ival+1 ) = s( 2*jblk-2*

     $            ibulge+2, 2*jblk-2*ibulge+1 )

               s( 2*jblk-2*ibulge+2, 2*jblk-2*ibulge+2 ) = h44

               s( 2*jblk-2*ibulge+1, 2*jblk-2*ibulge+1 ) = h33

               s( 2*jblk-2*ibulge+1, 2*jblk-2*ibulge+2 ) = h43h34

               s( 2*jblk-2*ibulge+2, 2*jblk-2*ibulge+1 ) = h10

            END IF

            h44 = s( 2*jblk-2*ibulge+2, 2*jblk-2*ibulge+2 )

            h33 = s( 2*jblk-2*ibulge+1, 2*jblk-2*ibulge+1 )

            h43h34 = s( 2*jblk-2*ibulge+1, 2*jblk-2*ibulge+2 )*

     $               s( 2*jblk-2*ibulge+2, 2*jblk-2*ibulge+1 )

            h11 = h( m, m )

            h22 = h( m+1, m+1 )

            h21 = h( m+1, m )

            h12 = h( m, m+1 )

            h44s = h44 - h11

            h33s = h33 - h11

            v1 = ( h33s*h44s-h43h34 ) / h21 + h12

            v2 = h22 - h11 - h33s - h44s

            v3 = h( m+2, m+1 )

            s1 = cabs1( v1 ) + cabs1( v2 ) + cabs1( v3 )

            v1 = v1 / s1

            v2 = v2 / s1

            v3 = v3 / s1

            v( 1 ) = v1

            v( 2 ) = v2

            v( 3 ) = v3

            h00 = h( m-1, m-1 )

            h10 = h( m, m-1 )

            tst1 = cabs1( v1 )*( cabs1( h00 )+cabs1( h11 )+

     $             cabs1( h22 ) )

         END IF

         IF( cabs1( h10 )*( cabs1( v2 )+cabs1( v3 ) ).GT.ten*ulp*tst1 )

     $        THEN

*           IBULGE better not be 1 here or we have a bug!

            nbulge = max( ibulge-1, 1 )

            RETURN

         END IF

         DO 40 k = m, n - 1

            nr = min( 3, n-k+1 )

            IF( k.GT.m )

     $         CALL ccopy( nr, h( k, k-1 ), 1, v, 1 )

            CALL clarfg( nr, v( 1 ), v( 2 ), 1, t1 )

            IF( k.GT.m ) THEN

               h( k, k-1 ) = v( 1 )

               h( k+1, k-1 ) = zero

               IF( k.LT.n-1 )

     $            h( k+2, k-1 ) = zero

            ELSE

*              H(m,m-1) must be updated,

*

               h( k, k-1 ) = h( k, k-1 ) - conjg( t1 )*h( k, k-1 )

            END IF

            v2 = v( 2 )

            t2 = t1*v2

            IF( nr.EQ.3 ) THEN

               v3 = v( 3 )

               t3 = t1*v3

               DO 20 j = k, n

                  sum = conjg( t1 )*h( k, j ) +

     $                  conjg( t2 )*h( k+1, j ) +

     $                  conjg( t3 )*h( k+2, j )

                  h( k, j ) = h( k, j ) - sum

                  h( k+1, j ) = h( k+1, j ) - sum*v2

                  h( k+2, j ) = h( k+2, j ) - sum*v3

   20          CONTINUE

               DO 30 j = 1, min( k+3, n )

                  sum = t1*h( j, k ) + t2*h( j, k+1 ) + t3*h( j, k+2 )

                  h( j, k ) = h( j, k ) - sum

                  h( j, k+1 ) = h( j, k+1 ) - sum*conjg( v2 )

                  h( j, k+2 ) = h( j, k+2 ) - sum*conjg( v3 )

   30          CONTINUE

            END IF

   40    CONTINUE

   50 CONTINUE

*

      RETURN

*

*     End of CLAMSH

*


      END

clamsh
subroutine clamsh(s, lds, nbulge, jblk, h, ldh, n, ulp)
Definition clamsh.f:2

max
#define max(A, B)
Definition pcgemr.c:180

min
#define min(A, B)
Definition pcgemr.c:181