]> sourceware.org Git - lvm2.git/log
lvm2.git
5 years agolv_manip: add synchronizations
Zdenek Kabelac [Mon, 26 Aug 2019 11:28:17 +0000 (13:28 +0200)]
lv_manip: add synchronizations

New udev in rawhide seems to be 'dropping' udev rule operations for devices
that are no longer existing - while this is 'probably' a bug - it's
revealing moments in lvm2 that likely should not run in a single
transaction and we should wait for a cookie before submitting more work.

TODO: it seem more 'error' paths should always include synchronization
before starting deactivating 'just activated' devices.
We should probably figure out some 'automatic' solution for this instead
of placing sync_local_dev_name() all over the place...

5 years agocache: improve vgremove loop
Zdenek Kabelac [Mon, 26 Aug 2019 11:28:00 +0000 (13:28 +0200)]
cache: improve vgremove loop

Support internal removal of 'cache origin' volume - which we
do not normally expose to a user - however internal processing
loops may hit this condition (depending on order of list LVs).

So when this operation is internally requested - we automatically
try to remove it's 'holding' LV (cache LV) - which will also
remove the origin.

5 years agosnapshot: always activate
Zdenek Kabelac [Mon, 26 Aug 2019 13:13:55 +0000 (15:13 +0200)]
snapshot: always activate

Drop the 'cluster-only' optimization so we do resume ALL device
before we try to wait on cookie before 'removal' operation.

It's more correct order of operation - alhtough possibly slightly
less efficient - but until we have correct list of operations
'in-progress' we can't do anything better.

5 years agoactivation: extend handling of pending_delete
Zdenek Kabelac [Fri, 23 Aug 2019 11:08:34 +0000 (13:08 +0200)]
activation: extend handling of pending_delete

With previous patch 30a98e4d6710a543692d40d11428ae4baea11b7b we
started to put devices one pending_delete list instead
of directly scheduling their removal.

However we have operations like 'snapshot merge' where we are
resuming device tree in 2 subsequent activation calls - so
1st such call will still have suspened devices and no chance
to push 'remove' ioctl.

Since we curently cannot easily solve this by doing just single
activation call (which would be preferred solution) - we introduce
a preservation of pending_delete via command structure and
then restore it on next activation call.

This way we keep to remove devices later - although it might be
not the best moment - this may need futher tunning.

Also we don't keep the list of operation in 1 trasaction
(unless we do verify udev symlinks) - this could probably
also make it more correct in terms of which 'remove' can
be combined we already running 'resume'.

5 years agodmsetup: debug print
Zdenek Kabelac [Fri, 16 Aug 2019 21:49:38 +0000 (23:49 +0200)]
dmsetup: debug print

Udev debugging is a bit tricky, so to more easily pair cookie ID,
which is the lowest 16 bit - print cookie as hexa number.
This simplify pairing of processed cookies while the 'higher bit flags'
are changed for the same cookie.

5 years agoactivation: add synchronization point
Zdenek Kabelac [Fri, 16 Aug 2019 21:49:59 +0000 (23:49 +0200)]
activation: add synchronization point

Resuming of 'error' table entry followed with it's dirrect removal
is now troublesame with latest udev as it may skip processing of
udev rules for already 'dropped' device nodes.

As we cannot 'synchronize' with udev while we know we have devices
in suspended state - rework 'cleanup' so it collects nodes
for removal into pending_delete list and process the list with
synchronization once we are without any suspended nodes.

5 years agopvmove: add missing synchronization
Zdenek Kabelac [Tue, 20 Aug 2019 10:23:08 +0000 (12:23 +0200)]
pvmove: add missing synchronization

Between 'resume' and 'remove' we need to wait for udev to synchronize,
otherwise udev may 'skip' resume event processing if the udev node
is already gone.

5 years agopvmove: correcting read_ahead setting
Zdenek Kabelac [Tue, 20 Aug 2019 10:30:25 +0000 (12:30 +0200)]
pvmove: correcting read_ahead setting

When pvmove is finished, we do a tricky operation since we try to
resume multiple different device that were all joined into 1 big tree.

Currently we use the infromation from existing live DM table,
where we can get list of all holders of pvmove device.
We look for these nodes (by uuid) in new metadata, and we do now a full
regular device add into dm tree structure.  All devices should be
already PRELOAD with correct table before entering suspend state,
however for correctly working readahead we need to put correct info
also into RESUME tree.  Since table are preloaded, the same table
is skip and resume, but correct read ahead is now set.

5 years agoman lvmthin: remove nonexistent topic
David Teigland [Mon, 19 Aug 2019 19:06:32 +0000 (14:06 -0500)]
man lvmthin: remove nonexistent topic

5 years agoconfigure: Fix setting of CLDFLAGS default
Marian Csontos [Mon, 19 Aug 2019 12:54:43 +0000 (14:54 +0200)]
configure: Fix setting of CLDFLAGS default

5 years agoconfigure: Fix the default in help string
Marian Csontos [Wed, 31 Jul 2019 14:24:18 +0000 (16:24 +0200)]
configure: Fix the default in help string

5 years agopvscan: disable sleeping and retrying for udev
David Teigland [Fri, 16 Aug 2019 19:35:17 +0000 (14:35 -0500)]
pvscan: disable sleeping and retrying for udev

When systemd is running pvscans, udev may not be
entirely initialized, so the pvscan should not
sleep and retry waiting for udev info.

5 years agobcache: increase max allowed bcache size
David Teigland [Fri, 16 Aug 2019 18:35:09 +0000 (13:35 -0500)]
bcache: increase max allowed bcache size

from 128MB to 512MB (the default remains 8MB)

5 years agotests: duplicate-pvs-md
David Teigland [Fri, 16 Aug 2019 18:22:58 +0000 (13:22 -0500)]
tests: duplicate-pvs-md

Testing duplicate PV handling for various md device setups/states.

5 years agopvscan cache: use lvmcache_label_scan
David Teigland [Thu, 1 Aug 2019 20:07:59 +0000 (15:07 -0500)]
pvscan cache: use lvmcache_label_scan

instead of the lower level label_scan.  The lvmcache wrapper
around label_scan checks for and eliminates more duplicate devs
and md components.

5 years agoimprove duplicate pv handling for md components
David Teigland [Thu, 1 Aug 2019 20:04:10 +0000 (15:04 -0500)]
improve duplicate pv handling for md components

Eliminate md components at the start so they don't
interfere with actual duplicates, and don't need
to be removed later.  This also allows for choosing
no copy of a PVID if they all happen to be md
components.

5 years agolvmcache: use devl list helper
David Teigland [Thu, 1 Aug 2019 18:58:14 +0000 (13:58 -0500)]
lvmcache: use devl list helper

5 years agolvmcache: replace found_duplicates variable
David Teigland [Thu, 1 Aug 2019 18:53:20 +0000 (13:53 -0500)]
lvmcache: replace found_duplicates variable

With just checking if the duplicates lists are empty.

5 years agolvmcache: renaming functions and variables
David Teigland [Thu, 1 Aug 2019 18:50:04 +0000 (13:50 -0500)]
lvmcache: renaming functions and variables

related to duplicates, no functional changes.

5 years agomd component detection addition in vg_read
David Teigland [Thu, 1 Aug 2019 19:43:19 +0000 (14:43 -0500)]
md component detection addition in vg_read

Usually md components are eliminated in label scan and/or
duplicate resolution, but they could sometimes get into
the vg_read stage, where set_pv_devices compares the
device to the PV.

If set_pv_devices runs an md component check and finds
one, vg_read should eliminate the components.

In set_pv_devices, run an md component check always
if the PV is smaller than the device (this is not
very common.)  If the PV is larger than the device,
(more common), do the component check when the config
setting is "auto" (the default).

5 years agodmeventd: avoid bail out preventing repair in raid plugin
Heinz Mauelshagen [Fri, 16 Aug 2019 14:25:08 +0000 (16:25 +0200)]
dmeventd: avoid bail out preventing repair in raid plugin

Problem:
even though dead raid component devices are detected, the
raid plugin is bailing out thus preventing a repair attempt.

Rational:
in case of component device errors, the MD resynchronization
thread runs in parallel with the thrown event being processed
by the raid plugin.  The plugin retrieves the raid device status
but that still reflects insync regions as 0 (when it should
already be total regions) because the MD thread didn't update it yet.

Solution:
Remove the insync regions check and let lvconvert carry out its
pre-repair checks and optionally carry out a repair attempt.

Resolves: https://bugzilla.redhat.com/show_bug.cgi?id=1560739
Related:  https://bugzilla.redhat.com/show_bug.cgi?id=1468590
Related:  https://bugzilla.redhat.com/show_bug.cgi?id=1654860
Related:  https://bugzilla.redhat.com/show_bug.cgi?id=1729303
Related:  https://bugzilla.redhat.com/show_bug.cgi?id=1741016

5 years agoudev: remove unsupported OPTIONS+="event_timeout" rule
Peter Rajnoha [Tue, 13 Aug 2019 13:18:30 +0000 (15:18 +0200)]
udev: remove unsupported OPTIONS+="event_timeout" rule

The OPTIONS+="event_timeout" is Unsupported since systemd/udev version 216,
that is ~5 years ago.

Since systemd/udev version 243, there's a new message printed if unsupported
OPTIONS value is used:

  Invalid value for OPTIONS key, ignoring: 'event_timeout=180'

Resolves: https://bugzilla.redhat.com/show_bug.cgi?id=1740666

5 years agotests: simplify some var settings
Zdenek Kabelac [Wed, 19 Jun 2019 22:03:18 +0000 (00:03 +0200)]
tests: simplify some var settings

scan_lvs now automatically comes with extend_filter_LVMTEST

5 years agotests: for cluster testing we always need exclusive mirrors
Zdenek Kabelac [Thu, 20 Jun 2019 09:07:43 +0000 (11:07 +0200)]
tests: for cluster testing we always need exclusive mirrors

Cluster test would fail without exlusively activated mirror.
FIXME: test is still broken, since LV2 is not active after split.

5 years agotests: accept also value 512
Zdenek Kabelac [Thu, 20 Jun 2019 12:20:35 +0000 (14:20 +0200)]
tests: accept also value 512

Older kernels provide fixed value 512 instead of 0.

5 years agotests: add settle wait before issue remove
Zdenek Kabelac [Thu, 4 Jul 2019 14:58:27 +0000 (16:58 +0200)]
tests: add settle wait before issue remove

Some older BB with older cryptsetup tool do not 'retry' on remove
and when  remove is issued right after 'fsck'  - it might be
rejected with:

Device @PREFIX@-tcrypt2 is busy.

Try to use udevadm settle.

5 years agotests: fix ra checking
Zdenek Kabelac [Tue, 18 Jun 2019 11:20:27 +0000 (13:20 +0200)]
tests: fix ra checking

Since with some installed package like 'tuned' the value of 'RA' on
PV origin device can be different, adapting tests to count with this.

5 years agotests: replaces grep -q usage
Zdenek Kabelac [Mon, 17 Jun 2019 20:47:35 +0000 (22:47 +0200)]
tests: replaces grep -q usage

Since we use 'set -euE -o pipefail' for shell execution,
any failure of any command in the 'piped' shell can result
in failure of whole executed chain - resulting in typically
unsually test skip, that was left unnoticed.

Since checked command have usually short output, the simplest
fix seems to be to let grep parse whole output instead
of quiting after first match.

5 years agomake: generate
Zdenek Kabelac [Fri, 9 Aug 2019 10:56:28 +0000 (12:56 +0200)]
make: generate

Run make generate.

5 years agocov: check for socket_path being set
Zdenek Kabelac [Tue, 25 Jun 2019 13:11:05 +0000 (15:11 +0200)]
cov: check for socket_path being set

As we check for existince on entering path
let's ensure it's there also on exit path.

5 years agocov: ensure cname exists before derefering it
Zdenek Kabelac [Tue, 25 Jun 2019 13:29:26 +0000 (15:29 +0200)]
cov: ensure cname exists before derefering it

Just make it clear to analyzers  cname can't be NULL.
TODO: maybe exclude NULL at front of the function...

5 years agolibdm: implement search for device names for older kernels
Zdenek Kabelac [Fri, 5 Jul 2019 23:21:39 +0000 (01:21 +0200)]
libdm: implement search for device names for older kernels

Kernels <2.6.27 don't have /sys/dev dir - add code for looking
out device name via longre seach in /sys/block

This makes commands like 'dmsetup dep -o blkdevname' working.

5 years agoexported_symbols: comment old symbols
Zdenek Kabelac [Tue, 30 Jul 2019 13:31:51 +0000 (15:31 +0200)]
exported_symbols: comment old symbols

Fix versioning for updated symbols dm_stats_create_region
and dm_stats_create_region.

Only the latest symbol should have global entry.

Since I'm not sure what is currenlty the best option for
old symbols - we added support for easy commenting of them
(so we do not lose information when the symbol appeared
for the first time.)

Note: some old already deleted symbols should have been
restored as comments.

5 years agomake: support comments in exported symbols
Zdenek Kabelac [Tue, 30 Jul 2019 13:31:01 +0000 (15:31 +0200)]
make: support comments in exported symbols

Now the lines starting with '#' in exported symbols files are treated as
comments (ignored).

5 years agotests: open-file-limit
David Teigland [Thu, 8 Aug 2019 20:21:26 +0000 (15:21 -0500)]
tests: open-file-limit

5 years agoincrease soft open file limit
David Teigland [Thu, 8 Aug 2019 18:11:05 +0000 (13:11 -0500)]
increase soft open file limit

When there are more devices than the current soft
open file limit (default 1024), raise the soft limit
to the hard/max limit (default 4096).

Do this prior to scanning in case enough of the
devices are PVs that need to be kept open.

5 years agodevices: put ifdef around BLKPBSZGET
David Teigland [Thu, 8 Aug 2019 20:43:09 +0000 (15:43 -0500)]
devices: put ifdef around BLKPBSZGET

BLKPBSZGET is not defined before kernel version 2.6.32
(e.g. rhel5)

5 years agodevices: clean up block size functions
David Teigland [Wed, 7 Aug 2019 16:38:06 +0000 (11:38 -0500)]
devices: clean up block size functions

Replace calls to the old dev_get_block_size function
with calls to the new dev_get_direct_block_size function,
and remove the old function.

5 years agoRevert "config: cache_policy should be cfg_runtime"
David Teigland [Wed, 7 Aug 2019 16:35:45 +0000 (11:35 -0500)]
Revert "config: cache_policy should be cfg_runtime"

This reverts commit 29eee32ac2fb3879eea04a8499219106411b4a37.

Some other changes are needed to make this runtime.

5 years agoconfig: cache_policy should be cfg_runtime
David Teigland [Mon, 5 Aug 2019 18:44:37 +0000 (13:44 -0500)]
config: cache_policy should be cfg_runtime

5 years agoconfig: set deprecated version for segment_libraries
David Teigland [Mon, 5 Aug 2019 18:31:59 +0000 (13:31 -0500)]
config: set deprecated version for segment_libraries

Stopped being used some time ago.

5 years agoWHATS_NEW: vgcreate/vgextend logical block size
David Teigland [Thu, 1 Aug 2019 15:15:27 +0000 (10:15 -0500)]
WHATS_NEW: vgcreate/vgextend logical block size

5 years agotests: allow-mixed-block-sizes
David Teigland [Thu, 1 Aug 2019 15:13:41 +0000 (10:13 -0500)]
tests: allow-mixed-block-sizes

5 years agovgcreate/vgextend: restrict PVs with mixed block sizes
David Teigland [Thu, 1 Aug 2019 15:06:47 +0000 (10:06 -0500)]
vgcreate/vgextend: restrict PVs with mixed block sizes

Avoid having PVs with different logical block sizes in the same VG.
This prevents LVs from having mixed block sizes, which can produce
file system errors.

The new config setting devices/allow_mixed_block_sizes (default 0)
can be changed to 1 to return to the unrestricted mode.

5 years agoWHATS_NEW: fix large physical block size
David Teigland [Tue, 30 Jul 2019 21:14:28 +0000 (16:14 -0500)]
WHATS_NEW: fix large physical block size

5 years agotests: large-physical-sector-size
David Teigland [Tue, 30 Jul 2019 20:59:11 +0000 (15:59 -0500)]
tests: large-physical-sector-size

5 years agoFix rounding writes up to sector size
David Teigland [Fri, 26 Jul 2019 19:21:08 +0000 (14:21 -0500)]
Fix rounding writes up to sector size

Do this at two levels, although one would be enough to
fix the problem seen recently:

- Ignore any reported sector size other than 512 of 4096.
  If either sector size (physical or logical) is reported
  as 512, then use 512.  If neither are reported as 512,
  and one or the other is reported as 4096, then use 4096.
  If neither is reported as either 512 or 4096, then use 512.

- When rounding up a limited write in bcache to be a multiple
  of the sector size, check that the resulting write size is
  not larger than the bcache block itself.  (This shouldn't
  happen if the sector size is 512 or 4096.)

5 years agotests: Fix unbound variable
Marian Csontos [Tue, 23 Jul 2019 13:36:13 +0000 (15:36 +0200)]
tests: Fix unbound variable

Test `aux kernel_at_least 5 1` fails even for newer kernel
with `$3: unbound variable` when using `set -u`.

5 years agotests: lvm-on-md use variable run dir
David Teigland [Fri, 12 Jul 2019 21:51:49 +0000 (16:51 -0500)]
tests: lvm-on-md use variable run dir

for hints file

5 years agotests: metadata-zero-space
David Teigland [Fri, 12 Jul 2019 19:08:22 +0000 (14:08 -0500)]
tests: metadata-zero-space

Test zero padding between copies of metadata.

5 years agometadata: extend writes to zero space
David Teigland [Mon, 1 Jul 2019 20:00:34 +0000 (15:00 -0500)]
metadata: extend writes to zero space

Previously, consecutive copies of metadata would have garbage
data in the space between them.  After metadata wrapping,
the garbage would be portions of old metadata.  This made
analysis of the metadata area more difficult.

This would happen because the start of new copy of metadata
is advanced from the end of the last copy to start at the
next 512 byte boundary.

Zero the space between consecutive copies of metadata by
extending each metadata write to end at the next 512 byte
boundary.  The size of the metadata itself is not extended,
only the write.  The buffer being written contains the
metadata text followed by the necessary number of zeros.

5 years agopvck: fix looping dump metadata_all
David Teigland [Fri, 12 Jul 2019 17:21:27 +0000 (12:21 -0500)]
pvck: fix looping dump metadata_all

dump metadata_all wouldn't quit if the metadata wrapped.

5 years agotests: pvscan-autoactivate test unmatching dev and PV size
David Teigland [Thu, 11 Jul 2019 16:38:12 +0000 (11:38 -0500)]
tests: pvscan-autoactivate test unmatching dev and PV size

5 years agotests: extend lvm-on-md
David Teigland [Wed, 10 Jul 2019 19:13:01 +0000 (14:13 -0500)]
tests: extend lvm-on-md

5 years agoenable full md component detection at the right time
David Teigland [Tue, 9 Jul 2019 19:48:31 +0000 (14:48 -0500)]
enable full md component detection at the right time

An active md device with an end superblock causes lvm to
enable full md component detection.  This was being done
within the filter loop instead of before, so the full
filtering of some devs could be missed.

Also incorporate the recently added config setting that
controls the md component detection.

5 years agopvscan: fix PV online when device has a different size
David Teigland [Tue, 9 Jul 2019 18:45:09 +0000 (13:45 -0500)]
pvscan: fix PV online when device has a different size

Fix commit 7836e7aa1c17216ed368fda89cfc805a07efda81
"pvscan: ignore device with incorrect size"

which caused pvscan to not consider a PV online (for purposes
of event based activation) if the PV and device sizes differed.

This helped to avoid mistaking MD components for PVs, and is
replaced by triggering an md component check when PV and device
sizes differ (which happens in set_pv_device).

5 years agomd component detection for differing PV and device sizes
David Teigland [Tue, 9 Jul 2019 18:32:41 +0000 (13:32 -0500)]
md component detection for differing PV and device sizes

This check was mistakenly removed when shifting code in commit
"separate code for setting devices from metadata parsing".

Put it back with some new conditions.

5 years agoscan: remove unused arg to setup_bcache
David Teigland [Tue, 9 Jul 2019 18:16:26 +0000 (13:16 -0500)]
scan: remove unused arg to setup_bcache

5 years agolvconvert: allow --stripes/--stripesize in 'mirror' conversions
Heinz Mauelshagen [Mon, 8 Jul 2019 17:07:18 +0000 (19:07 +0200)]
lvconvert: allow --stripes/--stripesize in 'mirror' conversions

This allows the creation of a striped mirror leg(s) during upconvert
by adding lvconvert command line options --stripes/--stripesize
for 'mirror' to tools/command-lines.in.

In case multiple mirror legs are being added, all will have the
same requested striped layout.

Resolves: rhbz1720705

5 years agoudev: do not overwrite ID_MODEL in 69-dm-lvm-metad.rules
Peter Rajnoha [Thu, 4 Jul 2019 10:57:55 +0000 (12:57 +0200)]
udev: do not overwrite ID_MODEL in 69-dm-lvm-metad.rules

We've been assigning this in 69-dm-lvm-metad.rules:

  ENV{ID_MODEL}="LVM PV $env{ID_FS_UUID_ENC} on /dev/$name"

This was for the description to appear for each systemd device
unit representing this device, for example:

  $systemctl -a | grep "LVM PV"
  dev-block-252:2.device                                                                                         loaded    active   plugged   LVM PV JhxC7B-YTgk-3jIU-5GVo-c4gV-W8t3-UUz06p on /dev/vda2 2
  dev-disk-by\x2did-lvm\x2dpv\x2duuid\x2dJhxC7B\x2dYTgk\x2d3jIU\x2d5GVo\x2dc4gV\x2dW8t3\x2dUUz06p.device         loaded    active   plugged   LVM PV JhxC7B-YTgk-3jIU-5GVo-c4gV-W8t3-UUz06p on /dev/vda2 2
  ...

However, there could be an actual ID_MODEL that people are interested in
more than the fact that this is an LVM PV and so we shouldn't overwrite
the value.

Also, we already have a symlink /dev/disk/by-id/lvm-pv-uuid-<PV_UUID>
created which is then reflected as device unit (all device's symlinks
have systemd device unit representation) so we can still reach this
information in systemd unit listings even without setting the ID_MODEL.

Reported here: https://github.com/lvmteam/lvm2/issues/21

5 years agocache: warn and prompt for writeback with cachevol
David Teigland [Tue, 2 Jul 2019 15:59:40 +0000 (10:59 -0500)]
cache: warn and prompt for writeback with cachevol

The cache repair utility does not yet work with a cachevol
(where metadata and data exist on the same LV.)  So, warn
and prompt if writeback is specified with a cachevol.

5 years agotest: Remove now useless clvmd test
Marian Csontos [Thu, 27 Jun 2019 09:14:00 +0000 (11:14 +0200)]
test: Remove now useless clvmd test

5 years agotest: Fix unbound variable
Marian Csontos [Thu, 27 Jun 2019 08:41:21 +0000 (10:41 +0200)]
test: Fix unbound variable

Test `aux kernel_at_least 5 1` fails even for newer kernel
with `$3: unbound variable` when using `set -u`.

5 years agotests: add exported.sh
David Teigland [Tue, 25 Jun 2019 20:45:47 +0000 (15:45 -0500)]
tests: add exported.sh

to test how commands work with exported VGs/PVs.

5 years agoexported vg handling
David Teigland [Fri, 21 Jun 2019 18:37:11 +0000 (13:37 -0500)]
exported vg handling

The exported VG checking/enforcement was scattered and
inconsistent.  This centralizes it and makes it consistent,
following the existing approach for foreign and shared
VGs/PVs, which are very similar to exported VGs/PVs.

The access policy that now applies to foreign/shared/exported
VGs/PVs, is that if a foreign/shared/exported VG/PV is named
on the command line (i.e. explicitly requested by the user),
and the command is not permitted to operate on it because it
is foreign/shared/exported, then an access error is reported
and the command exits with an error.  But, if the command is
processing all VGs/PVs, and happens to come across a
foreign/shared/exported VG/PV (that is not explicitly named on
the command line), then the command silently skips it and does
not produce an error.

A command using tags or --select handles inaccessible VGs/PVs
the same way as a command processing all VGs/PVs, and will
not report/return errors if these inaccessible VGs/PVs exist.

The new policy fixes the exit codes on a somewhat random set of
commands that previously exited with an error if they were
looking at all VGs/PVs and an exported VG existed on the system.

There should be no change to which commands are allowed/disallowed
on exported VGs/PVs.

Certain LV commands (lvs/lvdisplay/lvscan) would previously not
display LVs from an exported VG (for unknown reasons).  This has
not changed.  The lvm fullreport command would previously report
info about an exported VG but not about the LVs in it.  This
has changed to include all info from the exported VG.

5 years agoscanning: open devs rw when rescanning for write
David Teigland [Tue, 11 Jun 2019 21:17:24 +0000 (16:17 -0500)]
scanning: open devs rw when rescanning for write

When vg_read rescans devices with the intention of
writing the VG, the label rescan can open the devs
RW so they do not need to be closed and reopened
RW in dev_write_bytes.

5 years agometadata: include description with command in metadata areas
David Teigland [Tue, 18 Jun 2019 21:10:06 +0000 (16:10 -0500)]
metadata: include description with command in metadata areas

Previously the VG metadata description field (which contains
the command line) was only included in backup/archive copies
of the metadata.  Now also include it in the metadata written
to the metadata areas.

5 years agovgchange: don't fail monitor command if vg is exported
David Teigland [Thu, 20 Jun 2019 20:59:36 +0000 (15:59 -0500)]
vgchange: don't fail monitor command if vg is exported

When monitoring, skip exported VGs without causing a command
failure.

The lvm2-monitor service runs 'vgchange --monitor y', so
any exported VG on the system would cause the service to
fail.

5 years agoconfig: Fix default option which makes no sense
Marian Csontos [Mon, 17 Jun 2019 17:08:28 +0000 (19:08 +0200)]
config: Fix default option which makes no sense

Default value is either undefined or commented, never both.

5 years agoconfig: remove filter typo
David Teigland [Mon, 17 Jun 2019 14:38:24 +0000 (09:38 -0500)]
config: remove filter typo

Remove unnecessary but harmless / in the filter string "a|.*/|".

5 years agopost-release
Marian Csontos [Sat, 15 Jun 2019 07:23:03 +0000 (09:23 +0200)]
post-release

5 years agopre-release v2_03_05
Marian Csontos [Sat, 15 Jun 2019 07:21:47 +0000 (09:21 +0200)]
pre-release

5 years agobuild: make generate
Marian Csontos [Sat, 15 Jun 2019 06:30:04 +0000 (08:30 +0200)]
build: make generate

5 years agofix man page generation
David Teigland [Fri, 14 Jun 2019 14:26:08 +0000 (09:26 -0500)]
fix man page generation

The man page generation for pvchange/lvchange/vgchange was
incorrect (leaving out some option listings) as a result of
commit e225bf5 "fix command definition for pvchange -a"

5 years agoWHATS_NEW for recent changes
David Teigland [Thu, 13 Jun 2019 22:44:14 +0000 (17:44 -0500)]
WHATS_NEW for recent changes

5 years agotests: aux have_writecache
David Teigland [Thu, 13 Jun 2019 16:36:18 +0000 (11:36 -0500)]
tests: aux have_writecache

function was never defined, causing writecache.sh to be skipped

5 years agovgchange: change debug message level
David Teigland [Tue, 11 Jun 2019 21:14:07 +0000 (16:14 -0500)]
vgchange: change debug message level

A debug message was mistakely left visible.

5 years agolvmcache: remove wrapper around lvmcache_get_vgnameids
David Teigland [Tue, 11 Jun 2019 19:09:13 +0000 (14:09 -0500)]
lvmcache: remove wrapper around lvmcache_get_vgnameids

This was left over from when there was an lvmetad
version of the function.

5 years agoremove unused trustcache option
David Teigland [Tue, 11 Jun 2019 16:42:49 +0000 (11:42 -0500)]
remove unused trustcache option

5 years agotests: correct checked target name
Zdenek Kabelac [Tue, 11 Jun 2019 14:40:44 +0000 (16:40 +0200)]
tests: correct checked target name

So when the target name happened to be a suffix of another one,
the grep was filtering incorrect line
(i.e. dm-cache && dm-writecache) - so do a line head matching.

5 years agofix command definition for pvchange -a
David Teigland [Mon, 10 Jun 2019 16:35:26 +0000 (11:35 -0500)]
fix command definition for pvchange -a

The -a was being included in the set of "one or more"
options instead of an actual required option.  Even
though the cmd def was not implementing the restrictions
correctly, the command internally was.

Adjust the cmd def code which did not support a command
with some real required options and a set of "one or more"
options.

5 years agolocking: fix repeated convert to ex
David Teigland [Mon, 10 Jun 2019 17:04:49 +0000 (12:04 -0500)]
locking: fix repeated convert to ex

Some uncommon commands like pvchange -a -u may
call convert to ex multiple times.

5 years agolvmcache: remove unused function
David Teigland [Fri, 7 Jun 2019 19:39:32 +0000 (14:39 -0500)]
lvmcache: remove unused function

Drop lvmcache_fmt_from_vgname(), the way it was called made
it identical to the existing lvmcache_vginfo_from_vgname().

5 years agovgsplit: simplify vg creation
David Teigland [Fri, 7 Jun 2019 19:30:03 +0000 (14:30 -0500)]
vgsplit: simplify vg creation

The way that this command now uses the global lock
followed by a label scan, it can simply check if the
new VG name exists, and if not lock it and create it.

5 years agolvmcache: remove unused code
David Teigland [Fri, 7 Jun 2019 18:51:33 +0000 (13:51 -0500)]
lvmcache: remove unused code

5 years agoreset cmd wipe_outdated_pvs
David Teigland [Mon, 10 Jun 2019 15:33:41 +0000 (10:33 -0500)]
reset cmd wipe_outdated_pvs

at the start of a command, which is needed in case the cmd
struct is reused.

5 years agolocking: reset global_ex flag at end of cmd
David Teigland [Mon, 10 Jun 2019 15:07:30 +0000 (10:07 -0500)]
locking: reset global_ex flag at end of cmd

These two flags may be not reset at the end of
the command when the unlock is implicit, which
is a problem if the cmd struct is reused.
Clear the flags in the general fin_locking.

5 years agoMerge remote-tracking branch 'origin/master'
Marian Csontos [Mon, 10 Jun 2019 15:05:04 +0000 (17:05 +0200)]
Merge remote-tracking branch 'origin/master'

* origin/master: (22 commits)
  tests: add metadata-bad-mdaheader.sh
  tests: add metadata-bad-text.sh
  tests: add outdated-pv.sh
  tests: add metadata-old.sh
  tests: add missing-pv missing-pv-unused
  metadata.c: removed unused code
  improve reading and repairing vg metadata
  add a warning message when updating old metadata
  vgcfgbackup add error messages
  vgck --updatemetadata is a new command
  move pv header repairs to vg_write
  process_each_pv handle outdated pvs
  move wipe_outdated_pvs to vg_write
  create separate lvmcache update functions for read and write
  fix vg_commit return value
  change args for text label read function
  add mda arg to add_mda
  keep track of which mdas have old metadata in lvmcache
  ability to keep track of outdated pvs in lvmcache
  ability to keep track of bad mdas in lvmcache
  ...

5 years agopost-release
Marian Csontos [Mon, 10 Jun 2019 15:04:30 +0000 (17:04 +0200)]
post-release

5 years agopre-release v2_03_04
Marian Csontos [Mon, 10 Jun 2019 14:59:49 +0000 (16:59 +0200)]
pre-release

5 years agotests: add metadata-bad-mdaheader.sh
David Teigland [Tue, 28 May 2019 20:20:30 +0000 (15:20 -0500)]
tests: add metadata-bad-mdaheader.sh

needs xxd command

5 years agotests: add metadata-bad-text.sh
David Teigland [Fri, 24 May 2019 20:58:05 +0000 (15:58 -0500)]
tests: add metadata-bad-text.sh

5 years agotests: add outdated-pv.sh
David Teigland [Fri, 24 May 2019 20:26:47 +0000 (15:26 -0500)]
tests: add outdated-pv.sh

5 years agotests: add metadata-old.sh
David Teigland [Fri, 24 May 2019 20:18:18 +0000 (15:18 -0500)]
tests: add metadata-old.sh

5 years agotests: add missing-pv missing-pv-unused
David Teigland [Fri, 12 Apr 2019 15:55:19 +0000 (10:55 -0500)]
tests: add missing-pv missing-pv-unused

5 years agometadata.c: removed unused code
David Teigland [Fri, 24 May 2019 17:23:08 +0000 (12:23 -0500)]
metadata.c: removed unused code

if 0 was placed around old vg_read code by
the previous commit.

5 years agoimprove reading and repairing vg metadata
David Teigland [Fri, 24 May 2019 17:04:37 +0000 (12:04 -0500)]
improve reading and repairing vg metadata

The fact that vg repair is implemented as a part of vg read
has led to a messy and complicated implementation of vg_read,
and limited and uncontrolled repair capability.  This splits
read and repair apart.

Summary
-------

- take all kinds of various repairs out of vg_read
- vg_read no longer writes anything
- vg_read now simply reads and returns vg metadata
- vg_read ignores bad or old copies of metadata
- vg_read proceeds with a single good copy of metadata
- improve error checks and handling when reading
- keep track of bad (corrupt) copies of metadata in lvmcache
- keep track of old (seqno) copies of metadata in lvmcache
- keep track of outdated PVs in lvmcache
- vg_write will do basic repairs
- new command vgck --updatemetdata will do all repairs

Details
-------

- In scan, do not delete dev from lvmcache if reading/processing fails;
  the dev is still present, and removing it makes it look like the dev
  is not there.  Records are now kept about the problems with each PV
  so they be fixed/repaired in the appropriate places.

- In scan, record a bad mda on failure, and delete the mda from
  mda in use list so it will not be used by vg_read or vg_write,
  only by repair.

- In scan, succeed if any good mda on a device is found, instead of
  failing if any is bad.  The bad/old copies of metadata should not
  interfere with normal usage while good copies can be used.

- In scan, add a record of old mdas in lvmcache for later, do not repair
  them while reading, and do not let them prevent us from finding and
  using a good copy of metadata from elsewhere.  One result is that
  "inconsistent metadata" is no longer a read error, but instead a
  record in lvmcache that can be addressed separate from the read.

- Treat a dev with no good mdas like a dev with no mdas, which is an
  existing case we already handle.

- Don't use a fake vg "handle" for returning an error from vg_read,
  or the vg_read_error function for getting that error number;
  just return null if the vg cannot be read or used, and an error_flags
  arg with flags set for the specific kind of error (which can be used
  later for determining the kind of repair.)

- Saving an original copy of the vg metadata, for purposes of reverting
  a write, is now done explicitly in vg_read instead of being hidden in
  the vg_make_handle function.

- When a vg is not accessible due to "access restrictions" but is
  otherwise fine, return the vg through the new error_vg arg so that
  process_each_pv can skip the PVs in the VG while processing.
  (This is a temporary accomodation for the way process_each_pv
  tracks which devs have been looked at, and can be dropped later
  when process_each_pv implementation dev tracking is changed.)

- vg_read does not try to fix or recover a vg, but now just reads the
  metadata, checks access restrictions and returns it.
  (Checking access restrictions might be better done outside of vg_read,
   but this is a later improvement.)

- _vg_read now simply makes one attempt to read metadata from
  each mda, and uses the most recent copy to return to the caller
  in the form of a 'vg' struct.
  (bad mdas were excluded during the scan and are not retried)
  (old mdas were not excluded during scan and are retried here)

- vg_read uses _vg_read to get the latest copy of metadata from mdas,
  and then makes various checks against it to produce warnings,
  and to check if VG access is allowed (access restrictions include:
  writable, foreign, shared, clustered, missing pvs).

- Things that were previously silently/automatically written by vg_read
  that are now done by vg_write, based on the records made in lvmcache
  during the scan and read:
  . clearing the missing flag
  . updating old copies of metadata
  . clearing outdated pvs
  . updating pv header flags

- Bad/corrupt metadata are now repaired; they were not before.

Test changes
------------

- A read command no longer writes the VG to repair it, so add a write
  command to do a repair.
  (inconsistent-metadata, unlost-pv)

- When a missing PV is removed from a VG, and then the device is
  enabled again, vgck --updatemetadata is needed to clear the
  outdated PV before it can be used again, where it wasn't before.
  (lvconvert-repair-policy, lvconvert-repair-raid, lvconvert-repair,
   mirror-vgreduce-removemissing, pv-ext-flags, unlost-pv)

Reading bad/old metadata
------------------------

- "bad metadata": the mda_header or metadata text has invalid fields
  or can't be parsed by lvm.  This is a form of corruption that would
  not be caused by known failure scenarios.  A checksum error is
  typically included among the errors reported.

- "old metadata": a valid copy of the metadata that has a smaller seqno
  than other copies of the metadata.  This can happen if the device
  failed, or io failed, or lvm failed while commiting new metadata
  to all the metadata areas.  Old metadata on a PV that has been
  removed from the VG is the "outdated" case below.

When a VG has some PVs with bad/old metadata, lvm can simply ignore
the bad/old copies, and use a good copy.  This is why there are
multiple copies of the metadata -- so it's available even when some
of the copies cannot be used.  The bad/old copies do not have to be
repaired before the VG can be used (the repair can happen later.)

A PV with no good copies of the metadata simply falls back to being
treated like a PV with no mdas; a common and harmless configuration.

When bad/old metadata exists, lvm warns the user about it, and
suggests repairing it using a new metadata repair command.
Bad metadata in particular is something that users will want to
investigate and repair themselves, since it should not happen and
may indicate some other problem that needs to be fixed.

PVs with bad/old metadata are not the same as missing devices.
Missing devices will block various kinds of VG modification or
activation, but bad/old metadata will not.

Previously, lvm would attempt to repair bad/old metadata whenever
it was read.  This was unnecessary since lvm does not require every
copy of the metadata to be used.  It would also hide potential
problems that should be investigated by the user.  It was also
dangerous in cases where the VG was on shared storage.  The user
is now allowed to investigate potential problems and decide how
and when to repair them.

Repairing bad/old metadata
--------------------------

When label scan sees bad metadata in an mda, that mda is removed
from the lvmcache info->mdas list.  This means that vg_read will
skip it, and not attempt to read/process it again.  If it was
the only in-use mda on a PV, that PV is treated like a PV with
no mdas.  It also means that vg_write will also skip the bad mda,
and not attempt to write new metadata to it.  The only way to
repair bad metadata is with the metadata repair command.

When label scan sees old metadata in an mda, that mda is kept
in the lvmcache info->mdas list.  This means that vg_read will
read/process it again, and likely see the same mismatch with
the other copies of the metadata.  Like the label_scan, the
vg_read will simply ignore the old copy of the metadata and
use the latest copy.  If the command is modifying the vg
(e.g. lvcreate), then vg_write, which writes new metadata to
every mda on info->mdas, will write the new metadata to the
mda that had the old version.  If successful, this will resolve
the old metadata problem (without needing to run a metadata
repair command.)

Outdated PVs
------------

An outdated PV is a PV that has an old copy of VG metadata
that shows it is a member of the VG, but the latest copy of
the VG metadata does not include this PV.  This happens if
the PV is disconnected, vgreduce --removemissing is run to
remove the PV from the VG, then the PV is reconnected.
In this case, the outdated PV needs have its outdated metadata
removed and the PV used flag needs to be cleared.  This repair
will be done by the subsequent repair command.  It is also done
if vgremove is run on the VG.

MISSING PVs
-----------

When a device is missing, most commands will refuse to modify
the VG.  This is the simple case.  More complicated is when
a command is allowed to modify the VG while it is missing a
device.

When a VG is written while a device is missing for one of it's PVs,
the VG metadata is written to disk with the MISSING flag on the PV
with the missing device.  When the VG is next used, it is treated
as if the PV with the MISSING flag still has a missing device, even
if that device has reappeared.

If all LVs that were using a PV with the MISSING flag are removed
or repaired so that the MISSING PV is no longer used, then the
next time the VG metadata is written, the MISSING flag will be
dropped.

Alternative methods of clearing the MISSING flag are:

vgreduce --removemissing will remove PVs with missing devices,
or PVs with the MISSING flag where the device has reappeared.

vgextend --restoremissing will clear the MISSING flag on PVs
where the device has reappeared, allowing the VG to be used
normally.  This must be done with caution since the reappeared
device may have old data that is inconsistent with data on other PVs.

Bad mda repair
--------------

The new command:
vgck --updatemetadata VG

first uses vg_write to repair old metadata, and other basic
issues mentioned above (old metadata, outdated PVs, pv_header
flags, MISSING_PV flags).  It will also go further and repair
bad metadata:

. text metadata that has a bad checksum
. text metadata that is not parsable
. corrupt mda_header checksum and version fields

(To keep a clean diff, #if 0 is added around functions that
are replaced by new code.  These commented functions are
removed by the following commit.)

5 years agoadd a warning message when updating old metadata
David Teigland [Wed, 6 Feb 2019 19:51:54 +0000 (13:51 -0600)]
add a warning message when updating old metadata

in an mda that had previously not been updated

5 years agovgcfgbackup add error messages
David Teigland [Wed, 6 Feb 2019 19:46:35 +0000 (13:46 -0600)]
vgcfgbackup add error messages

5 years agovgck --updatemetadata is a new command
David Teigland [Wed, 6 Feb 2019 19:39:41 +0000 (13:39 -0600)]
vgck --updatemetadata is a new command

uses vg_write to correct more common or less severe issues,
and also adds the ability to repair some metadata corruption
that couldn't be handled previously.

This page took 0.077736 seconds and 5 git commands to generate.